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Étienne HALPHEN 
1911-1954 


Etienne HALPHEN était né le 27 mai 1911 à Bordeaux, où son père 
était alors professeur à la Faculté des Lettres. Son grand-père, Georges- 
Henri HALPHEN, éminent mathématicien, mort à quarante-quatre ans, 
avait laissé une oeuvre considérable et variée. (Théorie des courbes al- 
gébriques, Traité sur les fonctions élliptiques, etc.) 


Etienne HALPHEN manifesta de bonne heure des dons exceptionnels 
pour la science mathématique : à dix-sept ans, élève de mathématiques 
élémentaires au Lycée de Bordeaux, il donna ‘'Un Théorème sur les qua- 
driques analogue à celui de Chasles sur les coniques!'!', qui fit grande im- 
pression parmi les géomètres de l'époque. (C.R. de l'Académie des Scien- 
ces du 18 mars 1929), 


Reçu en 1930 aux concours d'entrée à l'Ecole Polytechnique et à 
l'Ecole Normale Supérieure, il choisit cette dernière où il devintagrégé de 
mathématiques en 1933. Professeur au Lycée de Sens durant un an, sa 
santé précaire le contraignit vite à abandonner l'enseignement. 

En 1936, il entra à la Recherche Scientifique. Durant quatre années, 
il allait se consacrer à la Statistique mathématique, dont les méthodes si 
fécondes venaient d'être introduites dans notre pays par M. le Professeur 
Georges DARMOIS. Les travaux qu'il poursuivit jusqu'en 1940 concernent 
tant la théorie que les applications. Sur le plan théorique, il étudia notam- 
ment des procédés d'estimation et mis au point sa ‘fonction caractéristique 
intrinsèque'', outil fécond et parfaitement original pour l'étude des distri- 
butions de probabilité. Ce travail fait d'Etienne HALPHEN un précurseur : 
les idées qui le guidaient sont celles-là mêmes que retrouvent aujourd'hui 
les mathématiciens qui construisent la Théorie de'l'Informätion. En ma- 
tière d'application, il s'occupa notamment de problèmes de biométrie, puis, 
en 1939-40, de problèmes intéressant la Défense Nationale. 


Puis ce fut l'occupation. Parmi tant d'autres, Etienne HALPHEN et 
sa famille devaient en souffrir. C'est pourtant dans cette période trou- 
blée qu'il commença à s'occuper dhydrologie etdÉconomie électrique. Des 
circonstances fortuites l'avaient mis en contact à Grenoble avec M. Pierre 
MASSE qui dirigeait à l'époque plusieurs sociétés hydroélectriques et qui 
se préoccupait de mettre sur pied des méthodes susceptibles de contribuer 
à une solution rationnelle des problèmes d'exploitation et d'équipement. 
Pour remplir cette tâche, des connaissances économiques ne suffisaient 
pas. Le caractère aléatoire des débits de nos rivières posait de nouveaux 
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problèmes. Il fallait jeter les bases d'une économie de l'incertain. Pour 
y parvenir, une formation statistique solide était indispensable. Etienne 
HALPHEN possédait cette formation. Mais il possédait bien autre chose : 
une aptitude à saisir dès la première rencontre la pensée de son interlo- 
cuteur, une ouverture d'esprit grâce à laquelle aucun problème ne lui de- 
meurait étranger, un.sens du concret qui mettait ses plus hautes spécula- 
tions au service de l'efficacité. Invité par M. Pierre MASSÉ à travailler 
pour la Société Hydrotechnique de France, il eut à étudier les problèmes 
les plus divers ; modèle hydraulique, prévision des crues et des étiages, 
valeur comparée des divers équipements ... Pour un statisticien les don- 
nées de base manquaient terriblement et des méthodes adéquates étaient à 
créer de toutes pièces. Ce fut là désormais une de ses tâches essentielles, 


Lors de la création d'Electricité de France, Etienne HALPHEN et 
ses collaborateurs furent rattachés au Service des Etudes et Recherches 
Hydrauliques dirigé par M. NI ZERY, qui fut enlevé à notre amitié il y a 
seulement quelques mois. C'est là qu'il continuait, comme ingénieur- 
conseil, à nous apporter la contribution irremplaçable d'une intelligence 


hors série. 


Il n'est pas possible de retracer dans le détail les travaux menés par 
Etienne HALPHEN ou sous sa direction en matière d'hydrologie. Quelques- 
uns sont bien connus de la Société Hydrotechnique de France. Mentionnons 
les mémoires publiés dans l'Annuaire Hydrologique en 1945 et 1946 : y 
furent exposés quelques travaux statistiques qui contribuèrent à la prépa- 
ration du premier Plan d'équipement. Mentionnons encore la communi- 
cation qui fut faite en 1949 sur les lois de probabilité des débits des cours 
d'eau. À ce propos, nous voudrions dire combien Etienne HALPHEN pre- 
nait à coeur ce problème des formes analytiques des lois de probabilité. Il 
y a plus de dix ans qu'il avait montré l'intérêt et la commodité d'emploi de 
celie qu'il avait appelée “loi harmonique'!. Pour les besoins de l'hydrolo- 
gie, avaient été introduites des formes plus générales qui garderont le 
nom de ''lois Halphen'' des types À et B. Leur auteur observait il y a quel- 
ques mois ; l'De telles lois manquaient en Statistique. C'est avec un cer- 
tain étonnement que nous constatons ce fait ; cinquante ans après les re- 
marquables travaux de Karl Pearson, nul ne semble d'être avisé que les 
lois de Person, si précieuses qu'elles aient été, sont très insuffisantes. !! 


L'étude des lois B avait conduit à envisager sous un jour nouveau une 
importante classe de fonctions ; il s'agit des fonctions hypergéométriques 
confluentes connues sous le nom de ‘'fonctions de Hermite!! qu'il préférait 
appeler ‘fonctions factorielles'', Elles lui avaient donné l'occasion de dé- 
couvrir une identité fonctionnelle bien remarquable, qui fait éprouver à 
tout mathématicien un plaisir et une surprise intenses : 


L e "2 (cos xz + sin xz )-dZ_ = et" _d2 
| à Vz 
Q 


© 


quel que soit x, réel ou complexe. Ce qui est frappant, c'est le fait que 
l'imaginaire ne figure dans aucun des deux membres de cette identité re- 
liant l'exponentielle et les fonctions circulaires. Pour Etienne HALPHEN, 
cette identité n'est qu'un cas particulier d'une ‘formule de réflexion! re- 
liant deux catégories de fonctions factorielles. 


Signalons encore parmi ses travaux les plus récents, une utilisation 
nouvelle de l'analyse harmonique dans l'étude des débits d'un cours d'eau. 
L'essentiel de la méthode a été indiqué dans une communication au Con- 
grés de l'Union Géophysique Internationale que s'est tenu à Rome en sep- 
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tembre. Son auteur avait grande confiance dans cette méthode d'analyse. 
Pourtant les bases théoriques restent à étayer, et c'est un difficile pro- 
blème. Mais les résultats concrets sont déjà assez remarquables pour 
qu'on accorde crédit à la méthode, Ainsi procède souvent le statisticien. 


Encore un mot sur les méthodes de travail d'Etienne HALPHEN et 
sur sa forme d'esprit. Deux traits fondamentaux le caractérisent ; C'est 
d'abord l'habitude et le besoin de repenser intégralement toute théorie, 
mathématique ou autre. A toute occasion il savait dégager des vues nou- 
velles, pratiquement toujours fécondes, Ensuite, il croyait au primat de 
l'empirisme : la théorie n'est qu'un outil qu'il faut adapter au mieux, 
Ajoutez à cela une forte dose d'intuition, et une honneteté intellectuelle 
scrupuleuse, Ne voilà-t-il pas les qualités qui définissent le statisticien 
idéal ? 


Son vieux rêve était que l'Ecole française de statisticiens, fût une digne 
émule des écoles anglo-saxonnes. Ceux qui ont eu la chance incomparable 
de travailler à ses côtés savent que, par les travaux nombreux qu'il nous 
laisse à exploiter ou à poursuivre, par sa façon originale d'envisager 
les problèmes, par la formation qu'il a donnée à quelques-uns, Etienne 
HALPHEN occupera une place de choix dans la statistique française. 


G. MORLAT 
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SUR LA DISCRIMINATION 
DES ENSEMBLES STATISTIQUES 


par 


Branislav V. IVANOVITCH 


1. INTRODUCTION 


En mesurant un caractère commun des éléments de deux populations 
n,etrnous obtenons les lois de probabilité f, (x) resp. f,(x) qui peuvent 
renfermer un domaine commun dans l'espace R' (fig. 1). La distinction 
entre deux populations en vertu de la mesure d'un seul caractère s'effec- 


f 


Fig. 1 


tue aujourd'hui selon un procédé standardisé, dont la théorie est très dé- 
veloppée. Cependant, les conclusions que l'on obtient sont souvent insuf- 
fisantes et on est obligé d'entreprendreles mesures de nouveaux caractères 
communs des éléments appartenant à deux populations pour avoir des ren- 
seignements supplémentaires dans le but d'arriver à des conclusions plus 
précises. 


En tenant compte de ces renseignements supplémentaires, on a été 
obligé d'élargir la théorie statistique, Ainsi dans le cas de deux ou plu- 
sieurs variables aléatoires, En outre, il existe déjà plusieurs méthodes 
pratiques qui élargissent les théories statistiques pour le cas de n varia- 
bles aléatoires, Presque toutes ces méthodes sont basées sur la distri- 
bution commune des variances etcovariances d'un échantillon de la popu- 
lation dont les caractères observés suivent les lois de Laplace. Wishart 
(1,2) et Bartlett (2) ont donné la forme analytique de cette distribution. 
Deux ans plus tard Hotelling (3) a réussi à donner la généralisation de la 
loi de ''Student'! (4). Enfin, Barlett (5,7), Wilks (6), Hotelling (8), Pla- 
ckett (9), Rao (10,11) ont publié plusieurs tests d'hypothèse servant à 
examiner : a) l'indépendance de plusieurs groupes de variables aléatoires; 
b) l'égalité des moyennes arithmétiques de n variables aléatoires dépen- 
dantes d'une population normale ; c) l'égalité des matrices de dispersion 
de deux populations normales, 
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R. A. Fisher (12,13,14,15) a indiqué .une nouvelle direction dans 
l'étude de la séparation de deux ou plusieurs populations en y introduisant 
la méthode des fonctions de discrimination. Il a montré qu'avec une suite 
de mesures de plusieurs caractères on peut former une fonction de discri- 
mination, linéaire selon les caractères mesurés, ayant la propriété de 
séparer deux populations mieux que n'importe quelle autre fonction linéaire, 
Ainsi on a réduit le problème au cas d'une seule variable aléatoire, re- 
présentée sous la forme d'une expression linéaire suivant les caractères 
observés, Les coefficients ont été déterminés de telle manière que la 
valeur de cette expression atteigne: son maximum. Cette méthode était 
appliquée jusqu'à présent à la technologie (19), à la sélection des plantes 
(18), aux sciences des finances (21), à la taxonomie (12), à la crâniomé- 
trie (16), à la psychologie (20,24), à la zoologie (25) etc.. 


Le but de notre travail était de présenter quelques nouveaux problè- 
mes de discrimination et de donner leurs solutions. 


Dans le premier chapitre nous avons exposé la théorie connue de la 
discrimination de deux populations en ajoutant toutefois quelques remar- 
ques. Nous avons d'abord présenté une interprétation géométrique de la 
fonction de discrimination de Fischer dans le cas où les deux populations 
sont normalement distribuées et ont les mêmes matrices de dispersion. 
Ensuite, nous avons montré comment on peut déterminer un plan de dis- 
crimination dans le cas où les deux populations sont normales et ont des 
axes parallèles, Lorsque les deux populations sont distribuées d'une façon 
quelconque, Welch est arrivé à déterminer la surface de discrimination 
dont la forme est en général compliquée. C'est pourquoi nous avons es- 
sayé, tout en nous servant des mêmes principes que ceux de Welch, de for- 
mer une nouvelle surface de discrimination qui serait toujours un plan. 
Dans le cas où les deux populations sont normales et ont les mêmes ma- 
trices de dispersion, les deux surfaces se réduiront au plan de discrimi- 
nation de Fisher. 


Dans le deuxième chapitre nous avons élargi la théorie de discrimi- 
nation en considérantle cas oùles caractères d'un oude plusieurs éléments 
se sont transformés sous l'influence de certaines causes. Si, par exemple, 
l'élément qu'il faut classer par rapport à deux populations se transforme 
de cette façon que les valeurs de ses caractères changent proportionnel- 
lement, il est évident que les méthodes précédentes, basées sur la diffé - 
rence des moyennes arithmétiques des caractères, ne correspondront 
plus à la nature du problème. Pour la discrimination de deux populations 
ne sont plus essentielles seulement les différences des moyennes arith- 
métiques, mais aussi leurs proportions. Ces considérations nous ont con- 
duit à construire une fonction, dite ‘fonction de disproportion!', qui s'a- 
dapterait mieux à la nature du problème mentionné. Dans le cas où Les 
valeurs des caractères de tous les éléments changent proportionnellement, 
d'après une loi connue de transformation, nous montrerons comment il 
est possible de résoudre le problème de la discrimination au moyen de la 
méthode de Welch. 


Lorsque la surface de discrimination est fixée d'avance et la forme 
mathématique des lois de probabilité de deux populations, contenant les 
mêmes paramètres inconnus, est connue, nous montrerons dans le tfoi- 
sième chapitre comment il faut déterminer les valeurs des paramétres 
inconnus afin que les distributions des populations soient établies de telle 
sorte que la surface de discrimination les sépare aussi bien que possible. 


Enfin, dans le quatrième chapitre de ce travail, on a observé le cas 
où nous connaissons la loi de probabilité de la population totale n= 1, +17, 
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sans connaitre celle den,etn,. Afin de pouvoir entreprendre la classi- 
fication des éléments particuliers de la population 1 par rapport aux po- 
pulations n, etn:, il est nécessaire de déterminer préalablement les lois 
de probabilité de ces populations. Dans le cas où il est possible d'expri- 
mer la loi de probabilité de la population 1, au moyen de celle den, parla 
transformation linéaire suivante. 


f, (x) EXT dE 


nous montrerons que le problème se réduit alors à résoudre une équation 
intégrale de Fredholm de seconde espèce dont la solution sera f, (x). 


Si l'on connait une suite de couples fi (x), f,; (x), i = 1,2...N, nous 
avons montré dans le même chapitre comment il est possible de trouver 
une approximation en moyenne du noyau k(x,£). Une telle détermination 
de k(x, £) nous permettra d'établir une dépendance statistique entre les 
lois de probabilité f, (x) et f,(x). Cette dépendance peut être plus ou moins 
forte et nous établirons un coefficient représentant la mesure de cette 
dépendance. 


Je suis heureux de pouvoir exprimer ici à M. le Professeur Georges 
Darmois toute ma reconnaissance pour son aide constante, ses encoura- 
gements et ses conseils qui m'ont été si utiles au cours de ce travail. 
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CHAPITRE PREMIER 


2. PLAN DE DISCRIMINATION 


Classer un élément, selon ses caractères mesurés, par rapport à 
deux POpuertons données n, etn, , qui s'étendent dans un espace à k di- 
mensions R*', représente un des problèmes principaux que se pose l'ana- 
lyse statistique à plusieurs dimensions. be. classification peut être faite 
en séparant l'espace R*' en deux régions RK et R“ qui s'excluent mutuel - 
lement ce qui nous permettrait d'accepter l'hypothèse selon laquelle l'élé- 
ment observé appartient à la population n; s'il se trouve dans la région 
RF Ge ,2). Il est évident que cette séparation de l'espace R* doit être 
faite aussi bien que possible, afin que l'erreur de classification soit ré- 
duite au minimum. 


Supposons d'abord que les populations ñn, etn, sont normales non- 
singulières et qu'elle ont les mêmes matrices de dispersion. Soient m, et 
my les moyennes arithmétiques de i-ème caractère des population n, et 
T2 » 


Wa Wa... Wix 
Won Wa : - Wok 
Wik War + Wkk 


la matrice de dispersion commune et 


1 Lu 
FANS RE RAS) RENE GA 2 


1 K/2 
(27) V W 
et 


Î LEZ w 0 (x-mi)(x, -m) 
Rx, XX) = 2e TT FOR ES a 
er. 


les lois de probabilité de ces deux populations où W représente la valeur 
du déterminant de la matrice de dispersion et wi les éléments de la ma- 
trice réciproque. Vu la supposition selon laquelle les populations sontnor- 
males non-singulières, il résulte qu'il n'existe aucun hyperplan dans l'es- 
pace R* pouvant contenir la masse totale de la population n; GAME) 


EZw° (xz=mE)(xs-mX) 


Soient &, ,...,4, les mesures des caractères d'un élément tiré de 
la population x . Nous savons à priori que cette populationne saurait être 
que, (OUT. 

Afin de donner une base de classification de l'élément £ (E,,...,Ex). 


posons ung surface (x, ,...,xx) = 0 qui partagerait l'espace R* un deux 
régions He et R:. Pour simplifier, supposons que la surface est un hy- 


perplan, c'est-à-dire. 


k 
(2:10 FENTE (x, = M 7x, = 0 
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et déterminons les coefficients À, de sorte que ce plan de discrimination 
sépare aussi bien que possible n, etn,. Considérons un élément x(x, ,..xx) 
de la pupulation —, . La distance de celui-ci au plan (2:1) est 


d = : Éx His) NAS 


La moyenne arithmétique de ces distances relative à la masse totale de la 
population 11, est donnée par la formule 


k 
Etdi=E (Sema), 
c'est-à-dire 


Ro 2e ES 


V=1 


On a également 
k 
E, (d) = 2 CmE ME) NS 


pour la moyenne arithmétique de la distance des éléments au plan (2.1)re- 
lative à la population], . La variance de la distance pour la population n; 
aura la forme 


Véta ee: far say, Fée Pac els 
c'est-à-dire 


Var; (d)= À à À LM Fr 102. 


=1 V=1 ÿ ? 


Vu l'identité des matrices de dispersion, il devient 
KogK 
Var. (d) = Var., (d')=-Var. (d)= à À Ag dv Wiv » 


Dans le but d'établir une mesure commune concernant les distances des 
éléments des deux masses au plan (2.1), divisons ces distances par la va- 
riance commune Var, (d). Les valeurs d/Var. (d) peuvent être positives 
ou négatives, selon que les éléments correspondants et le centre des coor- 
données se trouvent ou ne se trouvent pas du même côté du plan (2.1). 


Afin de séparer les populations HN, et I, aussi bien que possible, nous 
allons déterminer la position du plan de telle sorte que le produit des mas- 
ses de la population fi , situées dans la régions RE ,; par leur distances 
normées à ce plan soit maximum, tandis que le produit des masses de x; 
dans R* (i + j) par leurs distances à ce même plan soit minimum. En d'au- 
tres D la masse totale de 7; dans RY doit être aussi grande et en même 
temps aussi éloignée que possible de plan de discrimination, tandis que la 
masse de ñ; dans R* doit être aussi petite et aussi proche que possible du 
même plan. On SVuteatE alors déterminer les coefficients À, de telle sorte 
que l'expression 


LÉ 


SN D) ME De 


CRE ATET VER 24 a CR GER ES AE) ET 


k k 
Var.(d) 2 à Xe Lo We 
avec la condition À Ne]: atteigne son maximum, En désignant 
Ÿ v x y 
dJ=mi-my, D A d=D, DE Xl S, km — 


VA « 
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et en annulant les dérivées partielles par rapport aux &, , on obtient le 
système d'équations. 


k 
S 
E Gewe =  d , Ve NA CT Ke 


Vu que S/D figure en facteur, les coefficients cherchés seront proportion - 
nels aux solutions du système linéaire 


Wa FIWBE NS eme + Wir Âk = d; 
MÉSANRITOMET 2 MtT. LA Etes + Wax Àx = 
Ces RAI TB de, Sleep Pantin lardons ui € 
SEX TEEN RENE EE + Wir Àx = du 


c'est-à-dire aux valeurs 


k 
GK3) \,= È Wide, Veneto 


En utilisant (2.3) on peut écrire D dans la forme suivante 
k k eV sa 
D= 7 \,d,= 2 à wW g dv - 


En multipliant la V -ème équation du système (2.2) par À, et en addition- 
nant toutes les équations du système, nous aurons 


KR UK k 
D AN eN = ad 2 
V=1 


&=1 v=i SYRIE CET. 


c'est-à-dire 


Par conséquent 


n° REX 
Max.[L = 2 > w dé d, . 

Il reste encore à déterminer le point M par lequel passe le plan de 
discrimination. Etant donné que les variable x, ,...,xk« suivent les lois de 
Laplace, on peut les exprimer par des variables nouvelles &, ,...,6, qui 
seront indépendantes en suivant également les lois de Laplace. En appli- 
quant le même procédé à ces nouvelles variables, nous obtiendrons les 
coefficients À, , tandis que les expressions 


k 


one dE, (d) _ Æ C&-my) X 


\} var. (Cd) E ÀŸ Gw 
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et 


k 
d-Es(d) -2 (&-mi)x 


(.6) \/ Ver. (a) SOI 


où my , mn »; et Oyy» On, Sont les paramètres transformés des deux po- 
pulations, auront les distributions normales N (0,1). 


Si nous prenons à présent un élément avec des mesures transformées 
ET ,...3 € qu'on veut classer, c'est-à-dire déterminer s'il appartient 
à la population 1, ou à la population 7, , nous obtiendrons - en remplaçant 
Evpar &S dans les formules (2.5) et (2.6) - deux valeurs numériques Lp, 
et Xp, qui représentent les écarts normaux correspondant aux probabilités 
de pi % (i = 1,2). Si Xpj dépasse le seuil de signification, onrejetteral'hy- 
pothèse que l'élément considéré appartient à la population ni . Remar- 
quons que le plan de discrimination est parallèle aux plans 


k k 
(2.7) £E (E-m)A = X9,\ À Ve ion 


et 


(2.8) ” Cm nu : XA0, 


et déterminons le point M de telle sorte que le plan de discrimination re- 
présente le lieu géométrique des point £ pour lesquels on a Xp; = —Ap:, 
c'est-à-dire 


PEER )E PEUT na). 


Il est facile de constater qu'on a dans ce cas 


k 
\ à À, dv 
Pr À pr = 
12 2 
e 
v Ÿ 
Morse Lalre à 
2 
Par conséquent, le plan de discrimination 
k 
dy my + m» 
(2.9) D 5 (Mn) 0 
br Ÿ 


k : : 
partage l'espace R° en deux régions RK et RÉ de telle manière que, si 
l'élément examiné se trouve dans la région R\ , on a 


) SPEARS) ral 
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s 1 Ed 
où l'on a posé 


Si l'on prend Xp, = - Àp, = seuil de signification, les plans paral- 
lèles (2.7) et (2.8) partageront l'espace R' en trois régions R* - C,;, 
C1 + Ca et RÉ - C;,. Si l'élément examiné E£° se trouve dans la région 
RŸ - Ci, on acceptera l'hypothèse quil appartienta la population n; (i=1,2) 
S'il se trouve dans la région Ci, cette hypothèse ne saurait être acceptée 
et tout ce que nous pouvons dire, c'est qu'il est plus probable qu'il ap- 
partient à la population ni qu'à la population ni (i # j). 


L'expression 


k ER 
_ — 5v 
D = À À,d, — . 2 w°" d, ds 

est nommée par P.C.Mahalanobis (22,23,26,33) ‘distance généralisée!'!, 
Elle représente la distance maximum à une dimension entre les popula- 
tions HN, et Nn,. Fisher, ainsi que Mahalanobis, considère cette distance 
comme une mesure de contraste entre les deux populations. Plus cette 
distance est grande, plus petite sera l'erreur de classification d'un élément 
examiné par rapport aux deux populations. Il est naturel de s'y attendre 
que l'erreur de classification diminue à mesure que le nombre de carac- 
tères observés augmente, Afin d'examiner cela, supposons d'abord que 
nous avons mesuré k caractères dont au moins une des différences 
dy = my - m}, (V=1,2,...,k), n'est pas nulle. La valeur correspon- 
dante de la distance entre les deux populations sera 


k L 
(2.10) Dx= À vd, 
où les coefficients À, sont représentés par la solution du système linéaire 


WP W,, Auæ d, 


(2.0) 


| 
Q 
La 


Wik À tee. + Wkk Àx = 


Ajoutons à présent r nouveaux caractères que nous pouvons supposer in- 
dépendants des k premiers. Nous avons donc en tout k + r caractères et la 
distance entre les deux populations sera 


k+r 


D _— 2 XS ds . 


En supposant d, = 0 pourV =k+1,...,k+r, les coefficients Àv repré- 
sentent la solution du système linéaire 


Woo mr Win Ohenet en ae 0 À, d, 
DAS AM EAU. Deer es, 0 Xe dk 
(2e 12) 0 she 0 Wk+1,k+1 .... Wk+1,k+r Lis 0 


ess elle) os Ma) e, à + at etes see sons Letre enr MNene 


[æ] 


Ounbates Dir Wekeisker roc nWutr Karl tes 
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de k + r équations, qui se décompose en deux, dontle premier se réduit au 
système (2.11) et le second au système homogène 


(22115) CP OM MEC COR 7 ae ol se 16 2ua% ed 'alesiouie: 0 de ee)» 
Wkat,ktr es Teese + Wksr,ker house = 0 


Pour cette raison les coefficients À, ,..., Àk conservent les mêmes va- 
leurs et vu la supposition dk = ... = dxsr = 0, on obtient 


Drxtr = Dr. 
: 2 
La distance dans ce cas-là n'a pas augmenté bien que nous ayons ajouté de 


nouveaux caractères et que, si l'on prend par exemple k = l et r = 1, on 
L 


X2 


! 
d 1 
Î ! 
nl ! 
i ! 
1 1 

! 
i i 
fl ! 
! 1 
i ! 
[l 
! (l 
! ! 


[æ]) 
RS 
x 
Ro 


x} XX 
Fig.2 


constate sur la fig. 2 que la masse commune diminue lorsqu'on ajoute un 
nouveaux caractère, c'est-à-dire 
x!" 


LS C6) + F2 0%,)] dx, > [ft KT 0 ,x2) | dx: dx 
x} s 


-Exemple numérique.- Considérons l'exemple suivant traité par 
Radhakrishna Rao (27) relatif à la crâniométrie, Au cours du mois d'aout 
1939, une société anglaise d'archéologie a fait des fouilles du camp High- 
down Hill (aux environs de Goring by Sea, Sussex, Angleterre). À cette 
occasion on a exhumé un squelette humain masculin dans un état relative- 
ment bien conservé. D'après les objets trouvés à côté du squelette on a 
conclu qu'il date environ 500 ans d'avant J.C., c'est-à-dire au commence- 
ment de l'âge de fer en Sussex. A cette époque les conquérants l'de fer!!' ont 
envahi Sussex, la population ayant été mélangée, la question se pose si le 
squelette trouvé appartenait à un homme de l'âge d'airain ou de l'âge de 
fer 
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Afin de résoudre cette question, il est nécessaire de connaitre les 
distributions des deux populations, Rao a utilisé les données recueillies et 
publiées sur les squelettes de l'âges d'airain (Morant (30)) et celles de 
l'âge de fer-romano-britannique (Goodwin et Morant (31})). On a pris les 
moyennes de sept caractères du crâne suivants ; 


L ,..... diamètre antéro-postérieur 

B ..... diamètre transverse 

B', , . . . diamètre frontal minimum 

S , . . . . courbe sagitalle totale 

PQ! . . . . courbe transversale biauviculaire 
H'. . . . . hauteur basion-bregma 


G'H. . . . hauteur faciale supérieure 


Le Tableau 2,1 contient les moyennes arithmétiques des longueurs (expri- 
mées en cm.) de ces caractères pour les deux âges en question, de même 
que les valeurs de ces mêmes caractères pour le crâne de Highdown. Rao 
suppose que les populations des deux âges sontnormales etque les matrices 
de dispersion sont identiques à la matrice de dispersion d'une grande popu- 
lation des crânes humains masculins de XVIIe siècle (Hooke (32) }). 

En appliquant la méthode de Y? en vue de tester l'hypothèse H,;, 
c'est-à-dire si le crâne de Highdown appartenait à l'âge d'airain, on ob- 
tiendrait une probabilité de 20 % ce qui veut dire que nous ne saurions re- 
jeter l'hypothèse H,. Pour cette raison, bien que la même méthode donne 
une probabilité de plus de 78 % que le crâne examiné appartient à l'âge de 
fer romano-britannique, la question reste ouverte, 


TABLEAU 2.1 
te moyennes arithmétiques crâne de 
caractères _— — Hibbdoun 


En utilisant la méthode de X? nous avons examiné si l'on peut ac- 
cepter l'hypothèse H,, à savoir que l'élément considéré appartient à la 
population n,, sans tenir compte du fait connu qu'il n'existe qu'une seule 
hypothèse alternative H,. 


Etant donné que la fonction de discrimination tient compte justement 
de ce fait, nous pouvons espérer d'obtenir des résultats plus précis. En 
effet, en appliquant la méthode des fonctions de discrimination; Rao a 
obtenu les probabilités de 0,84 % et 59,8 %, ce qui veut dire qu'on peut 
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accepter l'hypothèse que le crâne de Highdown appartenait à l'âge de fer 
romano-britannique. 


3. DÉTERMINATION DU PLAN DE DISCRIMINATION LORSQUE LES 
POPULATIONS JT, ET JL, SONT NORMALES ET LES AXES PRINCIPAUX 
PARALLÈLES 


Soient de nouveau les population A, et, normales et les axes prin- 
cipaux parallèles, ce qui peut arriver lorsque par exemple 


(1) (2) 


2 
(DE (2) 
Wov — Wow 
Dans ce cas nous pouvons aussi exprimer les variables x,,...,x4, par des 


variables nouvelles E, ,..., EK qui seront indépendantes et Laplaciennes. 
Soient O,, et Gy2 les écarts-types des populations transformées et dési- 
gnons dy, = MY - mY . Il s'agit ici de deux fonctions de discrimination 


n 
k 
D = À Sd ul mue 
etnous déterminerons les coefficients Li, de telle façon que les expressions 

È 2 

OPA Tir ide 
DU dont sdter di anrolen 2e 
2 

Si Avi Ovi 


V=1 


atteignent leurs maxima. Par une voie analogue on obtient 


et les expressions 


k 
2 (E,-mr)2X 
(3.1)  —— ; ; 3 = 
£ À, Ov, 


(572) 


suivront la loi de Laplace N (0,1). 


s 


Pour l'élément observé à mesures transformées E° ,..., EX qu'on 
doit classer, c'est-à-dire déterminer s'il appartient à la population TH, ou 
à la population 1, , nous obtenons en remplaçant £, par £° dans les ex- 


SUR LA DISCRIMINATION DES ENSEMBLES STATISTIQUES 219 


pressions (3.1)et (3.2) deux valeurs numériques Àp, et Àp, quireprésentent 
les écarts normaux correspondant aux probabilités pi %, (i= 1,2), Sid; 
dépasse le seuil de signification, on rejetera l'hypothèse que l'élément 
considéré appartient à la population n; . Les plans 


k 


L (E,- my ) Àv,= Xp S 


k 
Æ Gsm) = ol S 


ne sont plus parallèles, Si nous prenons de nouveau pour le plan de dis- 
crimination le lieu géométrique des points pour lesquels Àp, = - Àp, , 
c'est-à-dire 


et 


Pr. (Een,)= Pr. (Eern,), 
son équation sera 
k ER k my À my du 
Ces. sn € = ee a. 
AE Ve Tee Dr) 


La différence entre ce plan de discrimination et le précédent (2.9) 
consiste en ce qui Àp, (= - À, )reste constant lorsque & se déplace dans 
le premier, tandis qu'il est variable lorsqu'il se déplace dans le deuxième. 


4. DISCRIMINATION DES POPULATIONS DANS LE CAS GÉNÉRAL 


Soient T1, et TN: deux populations qui s'étendent dans un espace à k 
dimensions R* avec les lois de probabilité £, (x, ,...,xx) et f2 (x1,...,x4) 
dont la forme peut être quelconque, 


Supposons d'abord que nous connaissons a priori les probabilités 
Pi (P1 + P2 = 1) selon lesquelles un élément observé & (€£, ,...,6K) 
appartiendrait à la population ni. Ce serait, par exemple, la détermina- 
tions du sexe des squelettes humains (E.S.Martin (17)). Le problème con- 
siste à séparer aussi bien que possible l'espace R* en deux régions RA et 
Rk qui s'excluent mutuellement et qui nous permettraient d'accepter l'hypo- 
thèse que l'élément £ appartient à la population ni s'il se trouve dans la 
région R“. Nous y arriverons en déterminant les régions R et R$ de telle 
sorte que l'erreur totale de classification 


œ = p fn av pe f f, dV 
RK RE 


soit la plus petite possible. En partant de la probabilité a postériori, selon 
laquelle l'élément £ appartenait à la population 7j , c'est-à-dire. 


pif; Cor En) 


TE ec co agee noie 
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on obtient directement 
D, Gérant) = DA ne) 


comme surface de discrimination. Par conséquent, la région R' est défi- 
nie par l'inégalité pif; > pifj (i#j, i,)=1,2) (Welch (28)). 


Si les probabilités p, et p, sont inconnues, Welch (28), en supposant 
que la masse de la première population dans R“ est égale à la masse de la 
seconde population dans Es ,; C'est-à-dire. 


fdv= ff dv, 


RK RK 


ou bien 


(4.1) fensro ver, 
l À 


il détermine la région RK de telle façon que l'expression 


Î f, dV 
(4.2) RK 


atteigne son maximum. Ces hypothèses faites il montre que l'hypersurface 
séparant les régions R* et R$ est donnée par 


f 
(4.3) 
où la constante C doit être choisie de telle sorte que la condition (4.1) soit 
satisfaite. C'est cette hypersurface que Welch prend comme la surface de 
discrimination des populations fN, et T1. 


CR NES CN NS 


En supposant la continuité des lois de probabilité f,; etf, en tout 
point de RK, on obtient ce résultat en cherchant le maximum de la fonction- 
nelle 


(4.4) BÉRÉD= ME a Céotioe)ade 


k 
R: 


où le paramètre À doit être tel que la condition (4.1) soit satisfaite, Soit 
P (x:,...,xK) un point frontière de RŸ et choisissons arbitrairement un 
élément AR de R* de volume AV> O0, dont P est un point intérieur. En 
supposant, par exemple, que AR est situé à l'intérieur d'une sphère cen- 
trée en P et de rayon P et en faisant tendrep , c'est-à-dire AV vers zéro, 
le quotient 


FCRY+AR*) - FR) 
AV 
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tendra vers une limite déterminée dont la valeur est 


BÉRÉ+AR AE") 


Lim. = 
AV+ 0 AV 
, Î 
= Lim, If AC +R)}dV= f-2(f4+f). 


AV 


Or pour que (4.4) soit un maximum, cette limite doit être égale à zéro 
d'où il résulte que dans ce cas tout point frontière doit satisfaire l'équation 


FOSC FTP) pr. 


En posant C = À / (1-1), cette équation se ramène à (4.3). 
Lorsque les deux populations sont normales et leurs matrices de 
dispersion égales, l'équation (4.3), qui peut être écrite sous la forme 
10g.: F5 000 PIC 
se réduit à 


c'est-à-dire au plan de discrimination de Fisher, 


Dans le cas où les matrices de dispersion de deux populations nor- 
males ne sont pas égales, Cedric A.B.Smith (29) montre que la forme ana- 
lytique de la surface de discrimination est une forme quadratique. 


La valeur minimum de la probabilité 


- fua- fra, 
RK cu 


calculée à la manière décrite ci-dessus, représente le degré de confiance 
relatif à l'hypothèse que l'élément Ë € R\ appartient à la population n; 
Rao (27) élargit cette théorie en D dnaot le cas lorsque æ& est au-dessus 
du seuil de signification. Dans ce cas- -là, nous ne pouvons pas accepter 
l'hypothèse que l'élément Ë de R* appartient à la population n; , malgré 
que la surface de discrimination était placée aussi bien ue possible. Pour 
cette raison Rao divise l'espace RK en quatre régions RAC: CN CNReE 
Re - C,. En désignantpar @, le seuil de signification, {1 est toujours pos- 
sible de déterminer la PAS C; de telle sorte que 


Ja 
C 


1 


atteigne son maximum sous la condition 


fra. 


C 
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En appliquant le calcul de variations Rao a obtenu l'inégalité f,> Kf, qui 
définit la région C:, la constante K étant déterminée de telle sorte que la 
condition (4.5) soit satisfaite. Si l'élément & $e trouve dans la région 
R* - C;, on accepte l'hypothèse qu'il appartient à la population n,. S'il 
se trouve dans la région C; , cette hypothèse ne saurait pas être acceptée. 
Tout ce que nous pourrions dire à ce sujet-là, c'est qu'il est plus probable 
qu'il appartient à la population x, qu'à la population n,. D'une façon ana- 
logue sera formée la région C2. Ces deux régions C;, et C, constituent 
ensemble une région dite l'douteuse!'!', car le problème reste sans solution 
lorsque l'élément examiné se trouve dans cette région. Dans ce cas on 
mesure les nouveaux caractères, afin d'éviter cette région douteuse. 


Remarquons encore que Rao (27, 34, 39)a élargi cetté théorie au cas 
de trois ou plusieurs populations. ; 


5. PLAN GÉNÉRAL DE DISCRIMINATION 


La surface de discrimination (4.3) peut avoir une forme bien compli- 
quée. Cependant, il arrive que la partie de cette face, qui partage le gros 
des masses de 71, et n, ne diffère pas beaucoup d'un plan. Il serait plus 
pratique dans ce cas-là de former une nouvelle surface de discrimination 
qui serait toujours un plan. 


Soit 
k=1 
(5.1) XKk= Ve + Z NS X y 
l'équation de ce plan et déterminons les coefficients Àv (V =0,1,2,..,k-1) 


de telle sorte que, à la condition que 


+ Xxk 


(5.2) ff ueroars, 


l'expression 


| AT 


atteigne son maximum. Désignons par 


(à (CARRE NES EE 2 PE ER AE à ins tree 


LR LA PO DU UE 
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Nid EX 


+ © + Xk 
= PU Es 1227) 
de sorte que cé ee 
ñ DE fn dv (i=1,2; v= 0,1 k-1) 
d ii ADM , , 25... . 


Le système de (k + 1) équations 


et 


ai PR EL Del er RO 


np Ne A5 CR 
F +R =1, 


déterminera alors les coefficients cherchés À, (V = 0,1,...,k - 1) ainsi 
que le paramètre À 


APPLICATION AUX POPULATIONS NORMALES A DEUX DIMENSIONS. - 


Soient 


ee je m,)?_ 2p(x-m, )CY= ma), CAD Lee 
| 2(-p5 | 6! 5,6; 


(Sr, Mere e 


et 


a ae m')°_ 2p'(x- mi)(y= m,) Re 
1 e 2(-PNÙ 07? 60: CE 


CARACAS noce PT 


les lois de probabilité des populations m1, et 71, et 


(5.7) y= ax + 


l'équation de la droite de discrimination que l'on cherche, Déterminons 
les coefficients à et à de telle sorte que la droite (5.7) sépare les popu- 
lations 1, et n, aussi bien que possible, Le système (5.4) se réduit au 
système de trois équations suivantes 


+ +0 


(5.8) ÉCOLE à fs. (x,ax+B)dx, 


CT - co 
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+ + 


(5.9) JA Ge œxr8r ax 2 à ace, axe 8) x 


-œ@ —@ 


8, (x, y) + f, (x,y)} dx dy=1. 


-@ 0 


En remplaçant (5.5) et (5.6) dans la troisième équation et en transformant 
les coordonnées nous obtenons 


+ +oo , +0 n2(6) 
1(x2 2 4 2 2 
js ane) e RE EUR RL IH, 
ue dé dn = Se dé dn 
Le 11(6) Lo = 
où 
(5.10) bre tsp COR Fee 
; iT oe TE Re -AO, k 
et 


Eu) L (E)= 1-p ao O1 +0 & am, -m,+Û0 


S Ro 1+p Sao 


De cette façon les fonctions, figurant sous les signes d'intégrales, sont 
identiques et symétriques par rapport au centre des coordonnées. L'égalité 
en question sera obtenue si les droites 


"1 CE) ei 0 
n2(4) AN 0 


se trouvent à la même distance du centre des coordonnées, c'est-à-dire si 


am, - M, + À ad œm;-mMm, + À 


(5.12) lafoi-2apoo, +0? afos- 204010 +0? 


En divisant l'équation (5.8)par l'équation (5.9) on élimine À et on aura 


+ o + 
Pr cc ax+8 ax Jr cext 0) & 
3) ———————2@© = : 
f, (x, œx+0) dx f,(x, œx + D) dx 


-_o -œ 
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En remplaçant (5.5) et (5.6) dans (5 . 13) et en intégrant nous obtiendrons 
la deuxième équation par @& et P 
m,O, -pO,o, (ma-m,+B)+(m,-6)o 
2 2 2 
(5.14) O2 -2P00,a+0,d 
m0 -p'oo,(ma-m,+B)+(m,-B)o;° @ 
OX - 2p'0:0,0+0,7a° 


Si les matrices de dispersion de n, et n, sont identiques, c'est-à- 
dire si O,=01, p=p' et C:=0, , l'équation (5.12) se réduira alors à 


. 


D, =mMm, F0 = = om, + m; - D 
et l'équation (5.13) à 
(m,-m;)o; - poo, [ Cm,-m!) où - (m,-m,) | +(m,-m,)oia= 0 
de sorte que 
= poo,d, -o:d; ae d; - Wa d: 
oi d,-PO,0,d; Mi de = Ward 
et ê 
Ws (m;-m') -2w, (mim,-mim,)+ We Cm: "ni 
Wa da - Wi ds 


= 


On pourrait facilement constater que la droite de discrimination ainsi ob- 
tenue coincide avec la droite de Fisher. 
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CHAPITRE Il 


6. CLASSIFICATION DES ÉLÉMENTS TRANSFORMÉS 


Nous avons vu que la construction de la fonction de discrimination 
de Fisher était basée sur la différence des moyennes arithmétiques des ca- 
ractères correspondants de deux populations, de sorte qu'il y aura un con- 
traste entre ces populations à moins que toutes les différences se réduisent 
à zéro. Cependant, cette méthode est valable lorsqu'on prend sous les con- 
ditions identiques les mesures des éléments des populations mn, et fl, ainsi 
que de l'élément examiné £ , ce qui n'est pas fréquent dans la pratique. 
C'est pourquoi la méthode de Fisher, qui a été utilisée d'une façon systé- 
matique dans bien des problèmes statistiques touchant les domaines les 
plus différents, ne correspond quelquefois pas à la nature du problème 
de la discrimination. 


Dans ce chapitre nous allons élargir la théorie de discrimination en 
considérant quelques cas, où les mesures des caractères des éléments 
XE T1 ,XEn: et x =46 ne sont pas prises dans les mêmes conditions. 
Lorsque, par exemple, l'élément & , avant d'être mesuré, s'est transfor- 
mé de telle façon que les valeurs de ses caractères ont changé proportion- 
nellement, il est évident que la méthode de Fisher cesse d'être valable. 
Pour la discrimination des populations 1, et 1, , ne sont plus essentielles 
les différences des moyennes arithmétiques mais leurs proportions, Ces 
considérations nous ont conduit à construire dans le paragraphe 7 une fonc- 
tion, dite ‘fonction de disproportion!'' qui s'adapterait mieux à la nature de 
ce problème. 


On trouve souvent dans la pratique de pareils problèmes, Ainsi, par 
exemple, les explorateurs scientifiques découvrent souvent des empreintes 
incrustées dans la pierre ou dans la glace appartenant aux diverses espèces 
humaines et animales. Etant donné que ces empreintes sont sujettes aux 
changements du volume, la méthode de la fonction de disproportion y trou- 
verait son application. 


Comme un autre exemple supposons deux populations d'adultes mn, et 
ñ: » telles que les dimensions des crânes de l'espèce n, soient visiblement 
plus petites que celles de l'espèce 1, . Prenons maintenant le cas d'un 
adolescent appartenant à l'espèce de la population n, , dont le crâne est 
approximativement semblable au crâne des adultes de la même espèce. 
En appliquant la méthode de Fisher, nous risquons d'obtenir une conclusion 
inexacte, à savoir que le crâne examiné appartient à l'espèce n,. Par con- 
tre, la méthode de Ia fonction de disproportion tient compte de la ressem- 
blance du crâne de l'adolescent à celui des adultes, et, par conséquent, elle 
serait plus efficace. 


Lorsque les valeurs des caractères de tous les éléments changent 
proportionnellement, d'après une loi connue de transformation, nous mon- 
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trerons dans le paragraphe 8, comment il est possible de résoudre le 
problème de la discrimination au moyen de la méthode de Welch. 


Enfin, remarquons que l'exemple de Rao dans le paragraphe 2 était 
bien fait, car il n'y a pas de modification dans les dimensions des os au 
cours de la dessication ou de la fossilisation. Cela s'explique par le fait 
que la substance minérale osseuse forme un réseau tridimensionnel sub- 
microscopique rigide etlorsque disparaissent l'eau et la matière organique 
contenues dans les mailles de ce réseau, les espaces laissés libres ne 
modifientni leur forme ni leurs dimensions, comme le prouvent les études 
optiques au microscope polarisant (C.A. Baud et M.J. Dallemagne (36)),. 


7. FONCTION DE DISPROPORTION 


Supposons que les valeurs des caractères de lÉlément examiné chan- 
gent proportionnellement de sorte que les mesures x;,,...,xk Se trans- 
forment en Tx,,..., t x,. Afin de classer l'élément transformé par rap- 
port à deux populations connues n, et —,, nous supposerons que ces deux 
populations sont normales non-singulières et que leurs axes principaux 
sont parallèles. Soient mx et my les moyennes arithmétiques du i-ème 
caractère des populations n, et2, 


(sx) ? (e HAE LES K , 
Ce yo) eg sa A 
leurs matrices de dispersion et 
1 ie 
LEE we (xe-mE)Cxo-mY) 
PACE) L 2€ 9 ï * v x 


(CHANENE 
LDE we (xx = mi) (xv - mY) 


1 +7 


GO | 


les lois de probabilité de ces deux populations, où w, et w, représentent 
des valeurs des déterminants de leurs matrices de dispersion et w*&*v et 
wY5Yv les éléments des matrices réciproques. Vu la supposition selon 
laquelle les populations sont normales non-singulières, il résulte qu'il 
n'existe aucun hyperplan dans l'espace R\ pouvant contenir la masseto- 
tale de la population n; (i= 1,2). 


FAX Xe 


Considérons la fonction linéaire par rapport aux x, (v=1,...,k) 


k 
X 
(71) z = ss Av —+ , 
v=1 mx 


où les coefficients À, satisfont la condition 


(se) PRE TR 
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Sixe TN, ,la moyenne arithmétique est nulle, tandis que la variance devient 


k K 
(726) Var., (z) = ee Z MAN CE, 
ou, tenant compte de (7.2) 
k-1 k-1 k-1 k-1 k-1 
(7.4) Var.,(z) = à Z Ah -2(2 \) ZE Àx Cex + (2 Xe) Cure 


Si x coincide avec la moyenne arithmétique dela deuxième population, nous 
obtenons 


k m* k-1 
(7.5) Q=L km EL Xe (2-21), 
où l'on a posé z, = my/mY. 
Formons le quotient 
Q° 
(7.6) Mr) Ut 


Plus la disproportion des moyennes arithmétiques des populations n, et 
n, est grande, plus grande sera la valeur de cette expression. Par consé- 
quent, cette expression peut être considérée comme une mesure de 
disproportion des moyennes arithmétiques des populations I, et I: 
Dans le but de séparer, d'une façon aussi bien que possible, les deux po- 
pulations, nous déterminerons les coefficients Ày de sorte que (7.6) at- 
teigne son maximum. En annulant les dérivées partielles de (7.6) par 
rapport aux À,(V = 1,...,k-J),on obtient le système d'équations. 


Var., (z) 


Q 


k=-1 
ÈË À x (go = Cyx= Cry + Eux) = KZ lat, 


Vie Rele 


Etant donné que l'expression Var.1(Z)/Q figure en facteur, les coefficients 
cherchés seront proportionnels aux solutions du système linéaire 


RAR QE PMR Are Zi 2R 
CT ER ne RE RER Le 7 2 
ka Mt Ritahat a Ris,k-1 Xp eZRre ze 


Rrv= Cv = Ceux = Cru FC 


Etant donné que Cev = Cve ; il Sera aussi Ryv = Rvg . La solution du système 
(7,7) sera 


Xe TX, R°? (as zx) si ES (PÈRE kK= 1: 
PRE k-1 k-1 
Àx.= SR (2,241 


q=1 va 
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En utilisant (7.8) dans la formule (7.5), on obtient 


k-1 K-1 
(7,9) qe 2 ZAR (2 24) (NZ) 


tandis qu'en multipliant la V -ème équation du système (7.7) par Àv et en 
additionnant les équations, on aura 


k-1 Kk-1 k-1 
LD RME Not )Ne 
ou bien ve Li 27 
k-1 k-1 k-1 k-1 k-1 


k-1 2 
>, Xe Àv Cev = 212 de) : Cut (2 À) Cux= à Àv (Z #24): 


ét ve e 
En utilisant les formules (7.4) et (7.5) il s'ensuit que 
(7.10) Not C2 0e 
d'où k-1 k-1 
(7211) Max. | Q°/ Var. , (z)! = z 2 Retz 26) 6252208 


L'expression (7.11) représente une mesure de disproportion, c'est-à-dire 
un contraste statistique entre les populations 7, et n:. Cettemesure sera 
égale à zéro siles moyennes arithmétiques correspondantes sont propor- 
tionnelles, L'expression (7.11) joue le même rôle que la distance généra- 
lisée Dx de Mahalanobis et, par conséquent, elle peut être utilisée dans la 
théorie de la séparation des populations en groupes de constellations. 


Etant donné que les axes principaux de n, et n, sont parallèles et 
que les variables x,,...,x4, suivent les lois de Laplace, on peut obtenir 
les Variables nouvelles E, ,...,tKk qui sont indépendantes en suivant éga- 
lement les lois de Laplace. En appliquant le même procédé à ces nouvel- 
les variables, nous obtiendronsles coefficients À, , tandis que l'expression 


É Es 5 my 
14 a 
= m Z: 
(7.12) = - = : 
[° Ÿ ©; 
4 > k 
v=1 € 


où m} et oœX sont les paramètres transformés de la population NH, aura 
la distribution normale N (0,1). 


En introduisant le rapport réciproque m} /m' dans la fonction de 
disproportion, on obtient par le même procédé les coefficients correspon- 
dants Àv , tandis que l'expression 


k ge v 
SAS 
À Ÿ 
(7.13) EE Done" arr 
| k F5 pl A+ 00 
> x? nv Z2 
Er BE my 


où m} etOn, sont les paramètres transformés de la populationn, , suivra 
également la loi normale N (0,1). 


: Si nous avons à présent un élément avec des mesures transformées 
1:--.:8Kk qu'on veut classer en sachant qu'il ne peut appartenir qu'à 
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l'une des populations T, et nm: et que cet élément a subi des changements 
proportionnels de ses caractères, avant d'être mesuré, nous obtiendrons 
- en remplaçant &v par &ÿ dans les formules (7.12) et (7.13) - deux 
valeurs numériques Àp, et Àp, qui représentent les écarts normaux cor- 
respondants aux probabilités de pi % (i = 1,2). Si kr; dépasse le seuil de 
signification, on rejettera l'hypothèse que l'élément considéré appartient 
à la population x; . En prenant pour le plan de discrimination le lieu géo- 
métrique des points pour lesquels Xp, = -Àp, , c'est-à-dire 


Pr.(£en,)= Pr. (ten,) 


son équation sera 


2107, Hr:0%= 0. 


8. CLASSIFICATION D’UN ÉLÉMENT TRANSFORMÉ PAR RAPPORT A 
DEUX POPULATIONS TRANSFORMÉES 


Soit f,(£, ,...,Ë£«) la loi de probabilité de la population —, et sup- 
posons que, sous l'influence de certaines ELLE ne caractères de tous 
les éléments ont changé proportionnellement, c'est-à-dire que 


(SA 2 ? Vimil suit 


où le facteur de proportionnalité t est une variable aléatoire qui peut va- 
rier dans le cas général de 0 à © , Soit p(t)sa loi de probabilité etw{t) 
sa fonction caractéristique, On obtient la population transformée n, en 
ajoutant aux éléments de la population primitive n, tous les éléments qui leur 
sont semblables, tout en tenant compte de la loi de probabilité du facteur de 
proportionnalité, Désignons par f;(x) = fi (x, ....xx«) la loi de probabilité 
de la populationn; , par Fi (x) = F; (x, ....xK«) sa fonction de répartition 
et par Yi (t) = its ....t,) sa fonction caractéristique, 


Soient (€, ,...,6,) et T les variables indépendantes dont les moyen- 
nes arithmétiques sont finies et supposons que l'intégrale 


F pct) 
/ t 


converge. En utilisant la formule de H. Cramer (35) pour la détermination 
de la loi de répartition du quotient de deux variables aléatoires, nous pou- 
vons introduire la fonction de répartition du quotient à k dimensions 


ler-t] 
Her 7 ET Ne Re 
où l'on a posé tx =t,x, . . . + txg . En supposant que nous pouvons 


dériver cette Esprebrion a EE aux variables x, ,...,x,4, on obtient 


£, (x) = ue sa CHERE 01e ; 
2ni 


232 BRANISLAV V. IVANOVITCH 


k ue 
HU I . En dérivant 4 (-tx) et en échangeant l'ordre des inté- 


x 0x, - OXu 
grations, nous aurons 


Î SANTO ; 
=——— |... t e L TOTAL 0e 
1 (x) GX | Ju | P(T) k 


+ + 


Î itTitx 
sf roc dT fl « w;(t) di th, 
ou bien 
(8.1) nee Ja (rx) TrptearE, 
0 
c'est-à-dire 
AOC Cm PETITS Xe) DUCIUL. 


o 


On voit que la loi de probabilité f, (x) est une fonctionnelle de f, (x) et 
nous pouvons écrire 


PO) Er]. 
Cette fonctionnelle est linéaire, car on a 
Flat! + bi ]= aF [1 | +bF PE 


quelles que soient les lois de probabilité fi (x) et fi (x) et quels que soient 
les nombres a et b. 


La fonction f, (x) représente une loi de probabilité, car la formule 
(8.1) nous montre quelle est positive et que 


fac dx, ERP € UNS = 

R*K 

- ff: (tx) t“p(t) dt OX: XL mir 
RAO 


Supposons qu'une nouvelle transformation des caractères, identique 
à la précédente, se soit produite. La loi de probabilité de la population 
transformée n;, sera 


(8.2) 


f00= F[f,] = f fantecoetss ftnr,x)dr dr... 


En général, si la population n, a subi en tout n transformations succes- 
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sives de sorte que chaque fois, lorsqu'on passe de ni ài,,, les valeurs 
des caractères changent proportionnellement avec la même loi p (xYte 
populationTn , aura comme sa loi de probabilité 


CRORANC ES DTA = ffaanptratn au der, 


En remplaçant 


Ti=t ; Lis le 
AP So NU 
la formule (8.4) devient 
fu VO = ff tot). pt) pe 5, (Ho) hd gt, 
[o) Q | ri t tou 
ou bien 
+ © 
(8.5) CAR) = f (4 Pn (t)f, (tx) dt 


Lo) 


+ + co 
(t,) dyant 
PAtt) = eee us 
o o t Las tt 


ps tt) = pt). 


Etant donné que la fonction p, (t) est positive et que 


ji Pant)dt=1, 


il en résulte que Ppn (t) représente une loi de probabilité, celle du facteur 
de proportionnalité en passant directement de n, à HN. Par conséquent, 
les formules (8.1) et (8.5) ayant la même forme, nous pouvons toujours 
supposer qu'on n'avait qu'une seule transformation. C'est pourquoi, dans 
la suite de notre exposé, nous resterons dans le cas n = 1. 


Exemple.- Soit 
2 -(ax+by) 
f, (x, y) = D (x+y) € ; r0 SUD > D, 


x>=0, y>=0, 


où l'on a posé 


la loi de probabilité de la population n, et 


œ" v-1 -aT 
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celle du facteur de proportionnalité T . En appliquant la formule (8.1) 
nous obtiendrons 


Abe 4 2 -+(ax+by+æ) 
FAIRE Y) CLR CCR ue e } dT = 
Me a+b ro! ï Â 

Ze ÿ 

ce) RE à x + 

= PUNTO x >0 > 0: 
a+b ['(v) (ax+by+a)”*" ? tal 
FONCTION CARACTERISTIQUE ET MOMENTS DE LA POPULA- 

TION 2 .- En désignant la fonction caractéristique de TN, par, (t), où 


t =t(t,,...,tx) représente également un point de l'espace R“, on a 


7 entire o)ox dx, 
RK 


[ CF (ide dr) 
RrK 


sera la fonction caractéristique de la population transformée n, . En uti- 
lisant (8.1) cette fonction peut être écrite sous la forme suivante 


pa (t) - ff ses (tx) tThplrldr dx. dx — 
o Rk 


- foto de lit FE) ds dE, 
o Rk 


= : 
(8.7) A(t) -[ PC) p (x) dr. 


En développant la fonction Ÿ: (t) en série aux environs du point t, = ..5t,=0 
on aura 


(8.6) w, (t) 


De même 


@2(t) 


ou bien 


q ED pm dr = f pt fisl(mitis…+ mit) + 


2 
Û 


neDmut+o(Et)|d , 


+ 


ou bien 


| à . 
(8.8) ylt)= 14. dE mitj+r a DE mistits+… 
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où nous avons désigné par mi et mjs , (j,s = l,...,k), les moments non- 
centrés du premier et du deuxième ordre de la loi de probabilité f, et par 
a_i les moments négatifs de p (t), c'est-à-dire 


oi 
CR ar P(Tdtr, Er 


o 


De (8.8) nous obtenons les moments non-centrés de la loi de probabilité 
de la population x, 


2 4 : 
M E,9-10M; , dé tratiker, 
2 . 1 : 
Mis = 8-2 M; LS ANSE 


Jon 


Surface de discrimination.- Supposons que nous avons constitué les lois 
de probabilité f, (x, ,...,xx) et f2(x:,...,xx) en mesurant sous les con- 
ditions À les éléments des populations I, et, . Si nous avons pris sous 
les conditions B les mesures d'un élément x° qu'on veut classer, c'est- 
à-dire examiner s'il appartient à I, où HN: ,; il est évident que nous ne 
pouvons pas appliquer la méthode de Welch en utilisant directement les 
lois f, et f,. Lorsque le passage des conditions À aux conditions B pro- 
voque un changement proportionnel des caractères de tous les éléments et 
lorsque nous connaissons les lois de probabilité du facteur de proportion- 
nalité T , c'est-à-dire p,(t) et p, (T), les lois de probabilité des deux po- 
pulations correspondant aux conditions B seront alors F, C£,] et F; f,] 
qui nous serviront pour l'application de la méthode de Welch. La surface 
de discrimination, séparant les régions R* et R$, sera donnée par 


(8.9) f, Cr] NON [a] ; 


où la constante C doit être choisie de télle façon que la condition 


(8.10) el Fe [re dV= 1 


soit satisfaite, Si l'erreur de classification 


af F Le dv 
Rf 


est inférieure ou égale au seuil de signification, nous accepterons l'hypo- 
thèse que x° appartient à la population 7; dans le cas où il se trouve dans 
la région R; 

Lorsque les lois p,(t) et P2(T) sont identiques, (8.9) et (8.10) deviennent 


F [r]=6 al 
{et : r[r. )dV=1, 


et 
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ou bien, vu la linéarité de l'opérateur intégralF , 


F[r Cf] = 0" 
‘l rfn+s] dV=1. 
Re 


Enfin considérons une population X dont une partie I, reste cons- 
tante tandis que les caractères de l'autre HN, = HN - T,, avec la même ré- 
partition, commencent à changer proportionnellement à partir du moment 
ti=its. La lol p dépendra alors de T ett . Soit f, (x; rs »XK) la loi de 
probabilité de 1, et 


FO, Ve F [s]= 


L° 


m1 Et DATE (oem 
p ; 


o 


et 


TOME PSE TS TT ENT ES FER CE) 


celle de 2 , La surface de discrimination 


ñ-cr[s]=0 
fenerfi]) av, 


se transforme au cours du temps. Si a représente le seuil de signification 


et si l'équation 
Y f d\ = 1-0 
ri 


a une seule racine réelle t = t;>t,,t, représentera alors le moment à par- 
tir duquel l'appartenance de chaque élément examiné pourra être statisti- 
quement déterminée. 


CHAPITRE Ill 


9. DÉTERMINATION DES PARAMÈTRES DE POPULATIONS LORSQUE LA 
SURFACE DE DISCRIMINATION EST CONNUE 


Supposons que nous connaissons les formes analytiques des lois de 
probabilité de 7x, et nm, contenant les mêmes paramètres inconnus 
œi (i=1,2,...,p). En faisant varier les paramètres @; on obtient une 
infinité de couples de lois de probabilité, chaque couple déterminant une 
surface de discrimination de Welch. 


Si la surface de discrimination est préalablement fixée, la question 
qui se pose est de savoir comment faut-il déterminer les valeurs de para- 
mètres œ; pour que les distributions soient telles que la surface de dis- 
crimination posée les sépare de la meilleure façon possible. 


Soit fixée, par exemple, la frontière entre deux Etats et soient À et 
B deux villes frontières voisines, À appartenant au pays L et B au pays II. 
Plus le trafic et l'échange des biens entre ces deuxEtats sontintenses, plus 
le développement de la population de la ville À dépendra du développement 
de la population de la ville B. C'est pourquoi les densités des populations 
des villes À et B dépendront des mêmes paramètres. Quant à la forme 
mathématique de leurs distributions elle peut être construite approxima- 
tivement en vertu des conditions géographiques, économiques etc., qui 
règnent dans la région en so Au cours du développement des villes 
À et B, il peut arriver qu'une partie de la ville À se trouve dans l'État 
voisin, c'est-à-dire sur le territoire de la ville B et vice versa. Ce fait 
peut produire des conséquences défavorables sur les rapports entre les 
deux pays. Il serait dans l'intéret de ces deux pays d'organiser le déve- 
loppement des villes À et B de telle façon que la frontière existante les 
sépare toujours aussi bien que possible tout en tenant compte de leur dé- 
pendance réciproque, La question qui se pose ici est de savoir ce 
qu'on doit entendre sous l'expression ‘'la séparation aussi bonne que pos- 
sible'', La réponse logique et juste qu'on pourrait donner à cette question 
serait la suivante : réduire au minimum le nombre d'habitants de la ville 
A qui se trouveraient dans le pays II ainsi que le nombre d'habitants de B 
dans le pays I, avec la condition que ces deux nombres soient égaux entre 
eux. 

Soient dans le cas généralfi (x, ...,x4 :0@0:5...,0tp)etf; (x, 52x15 
A:,,...,0p)les lois de probabilité des populations TH, et TH: à K dimensions. 
Si la surface fixée de discrimination sépare l'espace R* en deux régions 
HoetiRet RSR, qui s'excluent mutuellement, notre problème se 
réduit hors à déterminer les valeurs des paramètres œ; (i=1,...,p), 
de sorte qu'à la condition 


(9.1) jf f dv fl f, dV 
R Rrk 
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l'expression 


(9.2) j. f, dV 
À vf, of, 


atteigne son maximum. Si les dérivées partielles 3@œ; et doi existent, 
et si nous pouvons admettre que la dérivée partielle de l'intégrale par 
rapport aux paramètres ©; est égale à l'intégrale de la dérivée partielle 
de la fonction sous le signe de l'intégrale, se système suivant de (p +1) 
équations 


nous permettra de déterminer les valeurs des paramètres inconnus 
oi (i=1,...,p) pour lesquelles l'expression (9.2) atteint son maximum. 


EXEMPLE A UNE DIMENSION.- Soient à 
_{x-mtCr)} 
(9.4) flots tire es TERRES 25; (t) 
ao, (t)1/27 


1 
Encre 
Oo: (th\f27 
les lois de probabilité de n, et 1, et x = & le point de discrimination. 
En supposant que 


Aix me Ct)y} 


(9:5), £(x:;: rt) = 203 (t) 


LA + 


(9.6) 1e Gsené=/ toire, 


= æ œ 


déterminons les paramètres T et t de telle sorte que 


œ 


(9.7) fitirt a 


atteigne son maximum. En remplaçant (9.4) et (9,5) dans (9.6), il vient 


LA A + © 
Cx- m2) -m.,} 
[l D 
MR X 
O\/27 O,\/2n 
QUE EE à 
u 


52 + © 


[e) 


[4] 
Q 
la 

I 
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2 


L : 25 : Pacs 
Etant donné que la fonctione”?2 est paire, nous obtenons l'égalité ci-dessus 
si 


CN LP NE AL 5 
(78) DAUNE T OU) 
Désignons par 
C7 ne 
ie 
(9-9) frs -/ est dE 
V2 
et 
œ nn r 
De 
ER er. = fra. e * dé 
\/27 


Le maximum de (9.7) à condition (9.6) représente un extremumlié. C'est 
pourquoi les valeurs t et T seront obtenus de l'équation (9.8) et de 


G-n) rai -o 


ù ÔT 
Re Te AC 
€ ÔT 


ou, en éliminant À, 
dF/Ot a 0®/0t 


oo dF/0t d®/0t 


Etant donné que de (9.9) et (9.10) nous avons 


: (œ- m,)? 
GE sites m; e F 202. 
ÔT o, [2 
(œ- m,)? 
OF RMS ET 7er, 
ot Gi V27 à 
è (œ-m,)°? 
d® be: Je m2: e # 202 
ÔT © ‘oU?7n 4 
1 _(œ- m2)? 
09 __(«-m,)o, A 702 : 
t ©; 27 
la formule (9.11) deviendra 
N=-iMm OnN dE M Où 
CN dise 


ou, si nous prenons en considération (9.8), 


RAA M ad, 


(9.12) mu TE) m', (T) 
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Le système des équations (9.8) et (9.12) donne les valeurs cherchées 
pour les paramètres t etTt. 


Si nous prenons, par exemple, que 


1 ne 
m, = MErrer à Oo, = 1+t : 

Î 2 
Fe en OR O, = 1+tt+t 
Rad on à É 


l'équation (9.12) se réduira à 

ET HITI AE TT) STI HAITI T)E 
et l'équation (9.8) à 

(1+t7)01+T) = (1+2T +t')(1+t+t2). 


Nous voyons immédiatement qu'une des solutions sera t = T = 0. Il est 
facile de vérifier que l'extrémum est un maximum, dans ce cas, dont la 


valeur est 
ra] jl 0 dx] = ®$(1). 


Les moyennes arithmétiques et les écarts types se réduisent à 
m,= œ-1, oO m,= œ+1 et œ=1, 
EXEMPLE A DEUX DIMENSIONS. - Soient 
ÉROMOTR  CTNE JL e “r{x-m(t, 5} -1{y-m (t,T)}® 


2 2 
(9.14) (x.y T1) ü sr ultor) -hiy- n2 (t,t)} , 


les lois de probabilité de x, et nt, et y = ax + b la droite de discrimina- 
tion. En supposant que 


+ +0 +æ ax+b 
(9.15) j RG) dd = / JF cuyseiträn ar 
Zœ© ax+b Too -œ 


déterminons les paramètres t et T de telle sorte que 
+ ax+b 


(9.16) PÉCREET 


atteigne son maximum. En remplaçant (9.13) et (9.14) dans (9. 15), il vient 


+ +00 + © ‘ax+b-n; 


1 em um tem fins 
le Sun) MATE 
l'E 1 V27 J'y T° 1 
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+ +0 a(é+n;)+b-n, 


(9.17) no d£ d d£ d 
\ on Ut e ie 
“o *a(&+m;)+b-m, 


Etant donné que les lignes de niveau de la fonction figurant sous le signe 
de l'intégrale sont des cercles centrés tandis que les frontières sont des 
droites parallèles, l'équation (9.17) sera satisfaite si les segments de ces 
droites sur l'axe de l'ordonnée sont égaux par leur valeur absolue mais du 
signe contraire, c'est-à-dire 


(9.18): am, (t,t)+b-m.(T,tl= -an, (tt) -b+rn,(t,t). 


Désignons par 


+o ax+b RENE m2 
-+ 
= [fief fr d& dn , 


+o ax+b a(E+ns)+b-n, 


er 
+ — d 
ru fn x ° dn dé, 


— co 


et cherchons leurs dérivées partielles par rapport àt ett: 


om 0 1 _{a(E£+m)+b-m,}° 

1 LES casa 2 _ 
one nt e dé = 
RL (a Ôt ot ) V2r 


at am; +b-m2 
nome om) 1e <br {E+2meb-ml Peur 


où l'on a posé 
» ca (ams kb m,) 
a +1 


e 
Il 


a*m° + 2am,(b-m,)+(b - m,)° 


(am, b-m,) /Ca+1)= 4? 


1 
Ld € Nr25 
La valeur de l'intégrale étant (a° +1) ”, nous avons 


0: E ( = (a om, a om, ) Î e _ d72 
on dt dt 27 (2*+1) 
D'une façon analogue on obtient 


Of — (3 om, … Os Î e-d72 


0t ÔT ÔT | IN 610 4 
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0$ = a dn a n; ) Dr te rdie 
dt dt ax0t \ETERE - 
d® on, On, 1 _ d?/2 
et = —_ = € 

dT fe OTUMLONT ) 2n(a*+1) : 


de sorte que l'équation (9.11) se réduit à 


0m, Om, on, dn, 
- A—— — 
T0 us 0 Ni) 
(9.19) A Dm, _ 0m 40m _ 0m 
ÔT ÔT ÔT ÔT 


Le système des équations (9.18) et (9.19) donne des valeurs cherchées des 


paramètres t et T. 


CHAPITRE IV 


10. INTERDÉPENDANCE DE POPULATIONS 


Supposons qu'on ait deux ou plusieurs populations ; lorsque nous exa - 
minons l'appartenance d'un élément à l'une de ces populations, il est dans 
la nature du problème que ces populations soient de la même espèce et 
qu'elles ne différent entre elles que dans l'accent de certains caractères. 
En d'autres termes, toutes ces populations doivent appartenir à un plus 
large groupe de classification, sinon la nature elle-même de l'élément 
observé (même sans mesurer d'une façon précise ses caractères par- 
ticuliers) serait déjà suffisante pour déterminer l'appartenance de cet 
élément. Aussi nous pouvons supposer qu'il existe une corrélation entre 
les populations observées. Dans le cas de deux populations à chaque 
changement de la première population n, correspond alors en général 
un changement de la seconde population n, . Une telle dépendance 
peut s'exprimer par une relation entre les lois de probabilité des 
populations H, et T1, , et nous supposerons, enfin, que la loi depro- 
babilité de la population nr, s'obtient de la loi de probabilité de la popula- 
tions TN, par une transformation linéaire. Nous verrons que ce cas ap- 
parait souvent dans les problèmes statistiques. Si l'on mesure un seul 
caractère et si f,{x) est la loi de probabilité de la population 1; , (i= 1,2) 


on aura alors A 


(10.1) AS RTCLTCRETS 


Pour que la fonction f,(x) ainsi définie, soit une loi de probabilité, il faut 
que le noyau k(x,Ë) satisfasse à certaines conditions et, en particulier, il 
suffit que k(x, & ) soit telle que f,(x), c'est-à-dire que 


+ 


(10.2) nn (E) K(X,E) dé 


soit intégrable dans toute intervalle fini, et que 


(10.3) KExX EE) 10, 
(10.4) fi k(x,E) dx=1. 


En effet, de (10.3) il résulte en premier lieu que f,(x) > 0, étant 
donné que f, (x) Z 0. 

En second lieu, afin de montrer que f,(x) est intégrable dans l'in- 
tervalle (-o, +) et que la valeur de cette intégrale est égale à 1, consi- 
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dérons l'intégrale 


[° wa faf à (ETC OO) der 


qui a, d'après (10.2),un sens pour tout x, et x, fini et positif. 


Or, on a d'une part, d'après le théorème de Dini-Lebesgue 


fafrexeces- Jam. f° Œ)k(Cx,8) dé = 
un. / ax fa ok 0 4 , 


HUOOP NO MEME ET STEU 


car de 


il résulte que 


+ 


o< fx (E)k(x,Ë) dE < frcoetn are ao. 
un. / @4e  kGD dx 
fre fre dx. 


D'autre part, en tenant compte de 


de k(x,E) d&<1 


1 


Donc, 


fofs (E)KC(X,E) dE 


f, (8) étant par hypothèse intégrable dans ( -o, +), par une seconde ap- 
plication du théorème de Dini-Lebesgue, on obtient 


X2 +0 + oo X2 
in. [af @ko ag im, RCE fre dx = 


= fin. Li f k GE) dx} dé = 
- f f,(&) dé = 1. 


ce qui démontre l'affirmation. 
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Etant donné que le noyau k(x,Ë Jest une fonction de deux variables, 
on peut exprimer d'une infinité de manières f,(x) au moyen de f,(x) par la 
formule (10.1). On pourrait dire que ce noyau représente la loi selon 
laquelle la population n, s'est transformée en n, . C'est pourquoi nous 
appellererons cette fonction ‘'la loi de révolution n, T2". Il existe évi- 
demment un nombre infini de lois de révolution pour lesquelles la popu- 
lation T1, pourrait être transformée en population n,. La spécification de 
cette loi dépendra de la nature du problème étudié. 


Par exemple, il arrive souvent dans la pratique que la population n, 
a subi des changements de façon telle que la valeur du caractère observé 
& soit transformée d'après l'une de deux lois suivantes 


ar) Wim —- O<t<+too, 


Den E= NT, 45 > (0). 


où t et T représentent dans le cas général des variables aléatoires avec 
les lois de probabilité r(t) et p (T). La loi de probabilité de la population 
transformée aura les formes suivantes 


œ 


81) fa (x) | CE CxeETEd ESS 


7 


+ 


& ( 
b) Go = f RO) LP dE, x2z0 
0 
Pour que l'intégrale de la formule b) ait un sens, il faut que l'intégrale 


“ fee) dt, ( y (t)=f.c. de bte 


1 
converge. Il est facile de constater que les deux noyaux figurant dans les 
formules a) et b) satisfont aux conditions (10.2) et (10.3). 

En général, si un paramètre p d'une loi de probabilité k(x;p) commence 
à varier en suivant la loi f, (p), la variable x changera alors sa loi de pro - 
babilité d'après (10.1), c'est-à-dire 


+ 


400 = / AD RICX SD Op 


Si nous avons le cas de n paramètres, il sera 


+ + 
me af € (pis: pan) KCXS ps, pal) .0pe 


Enfin, nous avons vu que Fisher et Mahalanobis supposent, à propos 
de la séparation et de la classification des populations, que les deux fonc- 
tions f, etf, sont des lois de Laplace et qu'elles ont les mêmes matrices 
de dispersion. Ce cas spécial peut être réduit à a) où la loi de probabilité 
f; serait la fonction de Dirac, c'est-à-dire 


C0 "ere 00 


ë, (EDR 
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œ 


avec la propriété 


11. APPROXIMATION EN MOYENNE D’UNE LOI DE RÉVOLUTION 


Supposons que dans une école on mesure lataille des enfants agés de 
13 ans au commencement de chaque année. À la fin de l'année on mesure 
de nouveau la taille de ces mêmes enfants. Il est évident que la seconde 
répartition des tailles ne sera pas identique à la première, vu la crois- 
sance sensible des enfants de cet âge. En répétant N fois la même expé- 
rience, nous avons reçu N couples de lois de probabilité. Soient w; (x) et 
fi(x), (1=1,2,...,N), les lois de probabilité de la taille des enfants au 
commencement, respectivement à la fin de l'année. Il est naturel d'admettre 
qu'il existe une certaine dépendance entre les lois de probabilité fi (x) et 
pi (x) et supposons qu'elle soit de la forme suivante 


(11.1) FO = [ pE) K(X,E) de. 


- © 


Essayons à présent detrouver parmi touteslois de révolution k(x,Ë) 
celle qui donnerait la meilleure représentation possible, donc l'estimation, 
de la loi de probabilité f(x). La détermination de la fonction k(x, & ) nous 
permettra d'établir une dépendance statistique entre les lois de probabilité 
f(x) et p(x). Cette dépendance statistique, à savoir la correlation existant 
entre les deux ensembles de répartitions de la taille des enfants, peut être 
plus ou moins forte et nous établirons dans le prochain paragraphe un coef- 
ficient représentant une mesure de cette dépendance, 


En interprétant l'expression l'la meilleure estimation possible! com- 
me l'approximation en moyenne d'une fonction, nous allons déterminer la 
fonction K (x, £) de telle façon que l'expression 


(11.2) PRET 3! KO E) qi CE) de | 


soit minimum. Ce sera Le cas si la fonction k(x,&)satisfait à l'équation 


à qi (4) Ê 8 60 +! K (x,t) y: (t) dt }= 0 ; 


ou 


(PS) À @Q8.00 = f KCx,t) À qi (6) (t) dt», 


c'est-à-dire une équation intégrale singulière de Fredholm de première 
espèce à noyau dégénéré (de Goursat), symétrique et positif. 

Dans la pratique nous rencontrons le plus fréquemment le cas où 
nous connaissons non pas les lois de probabilité f; (x) et wi (x) mais les 
fréquences par classes d'intervalles, c'est-à-dire les valeurs. 

vh vh 


fiv - fic ; Piv = wi (x) dx, 


(v-1Dh (v-1)h 
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(VEND na ii = 2 ,N), h étant la longueur de l'intervalle de clas- 
se et n le nombre d'intervalles, En posant 
vh 


(11.4) 
Ke - / K (x, 83) dx 


avec (v-10)h 
(LIN SE < Ch; 


(11.1) prend la forme de la transformation linéaire 


n 
(11.5) = 2, K vg Pr s Vd = nr et (rt 
et la condition (10.4) devient 
n 
(11.6) £ Kyg = 1. 


2 


L'équation intégrale (11.3) se réduit alors à un système à n? équations 


linéaires avec les inconnues Kyy (V,C =1,2,...,n) 


(11.7) 2 K or Z Pig Pir = Z fiv Pix ° ViCæi,, in, 


î 
ou, en désignant 
Sgr — Z Piv Pir , Qvx = Z fiv Pix 


i 


le système (11.7) devient 


(11.8) Sy: Ke + Sg2 Ky2+e..+ Sen Kyn= Que , 
( V,Q =1,2,...,n), qui se décompose en n systèmes de n équations linéaires 
Sy Sa Jin K vs Qs 
(11.9) Sx Sn San k 2 = Qv2 | 
= 1,2 n Sn Sn2 dan K yn Qun 


Pour que ces systèmes soient résolubles, il faut que le déterminant 
S associé aux systèmes (11.9), c'est-à-dire 


N N N 
> qi L Pis Pi2 ere ete Z ii in 
N N N 

ns 4 Qu Pia » Pi2 RO L Piz Pin 


a la vs à» state ets ere) e ns aclets eo deñsl:e ta lee)" ea ee r.o ere 


» Pit Pin L Pa Pin s….. » Pin 
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soit différent de zéro. En décomposant ce déterminant en une somme de 
déterminants n'ayant que des monomes comme éléments nous constatons 
que chaque déterminant, ainsi formé, aura au moins deux colonnes iden- 
tiques si N< n. Par conséquent, il faut que N > n pour que le détermi- 
nant S, associé aux systèmes (11.9) soit différent de zéro. 


Les solutions des systèmes (11.9) sont données par les formules 
(11.10) kvy = 5e Qu + SF Q,+...+ SQu, 
ASS bec 

où les coefficients S°® désignent des éléments de la! matrice inverse de 
S y 

Il est facile de vérifier que les coefficients (11.10) satisfont les con- 
ditions (11.6). 

En effet, les égalités 


2 Qyx = Z D fi Vies pie LP 2 Pis 


U 


LS; = LE vx Pi = Ex Di = E Pi ; 


nous montrent que 


ZQ% = LS; , 


Ÿ 


d'où 
Éteee L Ce tease Q,#) = 
RS OR RSS NE 
j J JAN) 
4 1% nt #7 
OS OS ANSE 
= SE Sg+.+ SE Sn RS, 
c'est-à-dire 
L Kyg = | 


Remarquons que la conditions (10.3)n'est pas nécessaire et que, par 
conséquent, les fréquences f, peuvent conserver leurs propriétés dans le 
cas où quelques-uns des nombres k, sont négatifs. 

Enfin, la somme totale des différences entre les valeurs exactes 


fiv et les valeurs ajustées, obtenues par la formule (11,5), est égale à 
zéro. En effet, 


L L (fi -È Kg Pix) 


N n n 


Lente -LLyxEkx = 


I 


iz1 V:1 Vai 


= N-N=0. 
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Etant donné que 


EEE ke pie (fi -E ko Qi) 


I 
<1 
A1 


kg (Que -E Ka Se) = 


== LE Kog (Qy - Qxd= 0, 


la variance résiduelle sera donnée par 


N n n 
LE Ho CS à Kg Pig )1 


Si nous obtenons comme solutions des systèmes (11.9) k,» = 
1, (V =1,2,...,n) et kvy = 0 (Ÿ #6), les deux répartitions de fréquences 
seront identiques ; fu = (V =1,2,...,n). Dans notre exemple un pa- 
reil cas n'aura certainement pas lieu, étant donné que les acroissements 
de la taille des enfants à 13 ans ne seront jamais tous égaux à zéro. 


Considérons à présent le cas inverse, le cas où les fréquences ww 
sont représentées à l'aide d'une transformation linéaire, par les fréquen- 
ces fv , c'est-à-dire 

n 


CHAT) p=L RORT ON CEE RAR RENS 


où ces coefficients k°° définissent la loi de révolution T;->nyet dont les 
valeurs seront représentées par les solutions de n systèmes à n équations 
linéaires suivantes 


Pr RE re k® Q® 
(2) F, A pe k? | = (es 
PROD PRES k” Qu 
où nous avons posé 
Poe Zi fiv fig ; V, Cat:2,.5,n 


Les solutions des systèmes (11,12) sont données par les formules 
(He 1) ke PP O ner PQ + ut PQ, 
VAG=LISA6 ER", 10}, 


où les coefficients P* désignent les éléments de la matrice inverse de 
(BP). Les coefficients (11.13) satisfont les conditions 


(11.14) DA RNA NC net ne 


Vs1 
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Remarquons que les deux déterminants symétriques S et P ne peu- 
vent pas être négatifs. Afin de démontrer cette propriété considérons par 
exemple le déterminant S. L'espérance mathématique de l'expression 


CE tipo 


c'est-à-dire 
n 


EE tigi)° = L'HOatntis 


i:1 j=1 


où les coefficients Àij représentent les moments du deuxième ordre des 
variables wi , ne peut pas être négative et le deuxième membre repré- 
sente, par conséquent, une forme quadratique non-négative par rapport 


aux t, ,..., tniavec la matrice des moments 
À, Ne SN ES 
= N" 
Ne ER ÉPRPA 


Il en résulte que la matrice symétrique (S,7 ) est non-négative et que 
tous les nombres caractéristiques sont eux aussi non-négatifs. Etant don- 
né que le déterminant S est égal au produit de ces nombres caractéristiques, 
on en conclut que S > 0, c.q.f.d. 


Exemple (11.1).- En comparant les Tables de mortalité de différentes 
époques on constate que la répartition des décédés parrapport à leurs âges 
évolue très sensiblement au cours du temps. Le progrès des sciences et 
l'élévation du niveau de vie ont amené une grande amélioration dans 
la mortalité au cours de derniers 150 ans. Prenons comme exemple les 
répartitions des décédés de la ville de Bâle pour la période 1901-1950. 
Etant donné que cette ville était pendant cette période épargnée des guerres 
et d'autres cataclysmes, il s'agit ici d'une évolution normale, Les Ta- 
bleaux 11.1et11.2 donnent les répartitions des fréquences moyennes, ab- 
solues et relatives respectivement pour les périodes 1901-1905, 1906-1910, 

+ 1946-1950 (39). 


TABLEAU 11.1 DECEDES PAR GROUPE D'AGE (Nombres absolus) 


AGE 0-9 10-19 20-29 30-39 40-49 50-59 60-69 de 70[Total | 


1901/05 
1906/ 10 
1911/15 
1916/ 20 


1921/25 
1926/ 30 
1931/35 
1936/ 40 
1941/ 45 
1946/ 50 


1901/05 
1906/ 10 
1911/15 
1916/20 
1921/25 
1926/ 30 


1931/35 
1936/ 40 
1941/45 
1946/ 50 


Afin de déterminer les valeurs kyx (v,4 = 1,2,.. 
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TABLEAU 11.2 DECEDES PAR GROUPE 


D'AGE (EN %) 


thode décrite ci-dessus, posons 


Les matrices (Q,x) et (Ss;) seront alors 


LÉ ELA v = Piv 
198457 44573 
32422 8815 
60402 15421 
Che 67812 17378 
87156 22803 
126853 32873 
170799, 42945 
36099 60129 
149074 32256 
8675 

(Sx)= 


76894 
16223 
29619 
32496 
44148 
66439 
87952 
125229 


56698 
15557 
29063 


88354 
17401 
32575 
36116 
48642 
73262 
99043 
140607 


65851 
16664 
3/22 
34532 


120336 
25248 
47870 
52835 
72598 

110419 

152085 

219609 


9157109) 
439103 
44410 
49264 
12559 


0-9 10-19 20-29 30-39 40-49 50-59 60-69 


173162 
39022 
75488 
81897 

115192 

178293 

246536 

359410 


133229 
34798 
68881 
75625 

113330 

181647 


232699 

52218 
105120 
114585 
163501 
258182 
366042 
537653 


182282 
46017 
93878 

105018 

160161 

259183 

381588 


au dessus 


É 


340525 

77651 
158505 
174881 
253960 
401679 
583598 
869201 


269291 

67940 
139611 
157924 
246644 
402307 
601873 
974410 
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Les solutions des systèmes (11.9) sont (1) 


iumiul; 295124 Ki 0, 009704 .K a =  0,048601 
Kiy2 =  3,559441 Kw = 1103847320 K > =  0,889007 
Ki =  0,693264 Kzs = -0,235984 K 3; = -0,913618 
K =  0,415440 K24 = -0,732079 Kiss e 6°0, 30212 
Kys = - 2,449983 K2s =  0,472662 Kiss 0521 00,200 077 
Ky = - 0,462046 Ken ln0 Set K 6 02 0, 72505 
PP. (0,202118 Ka =  0,082910 Ka =  0,344997 
RAS € 0.201001 K:s = -0,133068 Ke = -0,283165 
EP =n0: 017792 Kss =  0,053443 Ka =  0,050822 
Ka =  1,696071 Ks2 =  1,814171 Kat=- "#1 6ti. 
Ka = - 0,778826 Kss = -0,336988 Kes = -0,024786 
Ku = 710,336155 Ks4 = 0 0,567827 Ke = =0,552959 
Kas = 0,323537 Rae f0. 34500000 Kés = -1,052749 
Kas =  0,147964 Ks =  0,497367 Kçe =  0,468044 
Ka =  0,383125 Ksr =  0,268409 Ke =  1,020751 
Ka = -0,157265 Kss = -0,023957 Kgs = -0,182600 
Kn = -0,151234 Ko = 0,:324253 

Kn = - 2,398636 Kg = -7,080928 

Kit T=eU0,233762 K's 48 00020 203176 

Kate. 1,443308 Ker = Pl. 720001 fiv = à Koe iss,g 

Kzys = 0,884617 Kes =  2,964539 Vel OLAER 
K =" 0,277144 Kss + = -0,422868 

He U0,041784 Ker = -1,444095 

KA L=00,390924 Ki = 1138131 


(1) Le calcul a été effectué par M. H. Rutishauser (E. T. H. Institut für angewandte 
Mathematik, Zürich). 
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Le tableau 11.3 donne les valeurs ajustées de f,, obtenues par la for- 
mule (11.5). 


TABLEAU 11.3 


0-9 10-19 20-29 30-39 40-49 50-59 60-69 | 2% FES 


1901/05 
1906/ 10 
191i/15 


1916/20 
1921/25 
1926/ 30 
1931/35 
1936/ 40 
1941/45 


I1 est facile de vérifier que la somme des différences des éléments 
correspondants des Tableaux, 11.2 et 11.3 est égale à zéro et que l'écart- 
type de ces différences ne dépasse pas 3,3 %o. 


On pourrait maintenant reconstituer la répartition moyenne des 
décédés à Bâle pour la période 1896-1900. En utilisant la répartition pour 
la période 1901-1905 et les nombres trouvés k%, on obtient par la formule 
(11.5) les valeurs 


f, =486 
fee 2; 
£2 = 051 
fa = 54 
fs = 75 
fe = 110 
f, 05100 
fe =101 


0 10 20 30 40 50 60 70 âge 
qui représentent l'estimation de la répartition moyenne des fréquences 
relatives des décédés à Bâle pour la période 1896-1900 


12. COEFFICIENT DE CORRÉLATION DE DEUX POPULATIONS 


Dans le but de former une mesure de l'interdépendance de deux en- 
sembles de populations Ti et miz (i = 1,2,...,N), posons 


(rat) R = 
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où l'on désigne de nouveau 


Q = LE qu fi 


, p | È fiv fig 


, s- Z Div Pix 


Le coefficient R ainsi défini sera appelé le coefficient de corrélation de 
IT, et den: . Dans le cas n =2, R devient le coefficient de la corrélation 
ordinaire de deux variables aléatoires, c'est-à-dire 


2 it fs ÈË Pi 
Di: N 
R =r = = 
TN ti LINE D 6 nl 
+ fe 2 NN ? Ë Pi N 


Démontrons que |R |est compris entre 0 et 1. En effet,nous pouvons 
transformer le déterminant Q de la façon suivante 


2 Pi fi: Ê Pis f ie > Pis te 


fi fin fi Pis Pist Pit 
= fi Fe fi Cie, Piaeceuifi 
RU RENE SN RSS te Lee | 

fn fin J0C fin Pin Pi,n Le Pin 
En posant, pour simplifier, 

te 
f 
(1292) DR, Sr 
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et 


(1243) A° 2 RES 


on obtient finalement 
(12.4) 


où les indices i,,... 


tières 1,2,...,N. A chaque systèmedenentiers (i,, i, ,... 


in prennent indépendamment toutes les valeurs en- 


;in) correspond 


un terme de la somme. On peut écrire plus simplement cette formuleen 


numérotant les systèmes d'entiers (i, ,i,,...,in) 


i = l au système dont 


. On donnera le numéro 


puis les numéros i=2,3,...,n + l aux systèmes dont 


n 
x i =nt+li 
J=1 


et ainsi de suite, Ainsi, à chaque système distinct de (i, ,i,,.. 
ile i= 12e . Le détermi- 


nant Q s'écrit alors sous la forme condensée 


L 
HE At a 


> x s RTE QUE 
aura associé un seul entier i = i(i, ,i2,... 


(12.5) 


. 10) on 


D'une façon analogue on peut écrire les déterminants P et S 


(12.6) P 


(12.7) S=— 2 (Af)° 


Î 

n! 
1 

n! 


i 


— ZL(A) 


L'application immédiate de l'inégalité de Schwartz 


2041 2 
HE At Af) -HLE (af) HE CA) < 0 


nous montre alors que R?< 1, c.q.f.d. 


L'égalité R? = 1 aura lieu si 
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On entire 


wWQ -P—=0 
wS -Q—0 


ou, en utilisant les formules (12.5), (12.6) et 12.7), on aura 
wQ-P=—Lx Af (wA#-A)=0, 
0 


WS-Q=—X AM (wAf-N) 


En multipliant la deuxième égalité par Ww etenla retranchant dela première 
il vient 


E (Af-wA?)'= 0. 


L'expression du premier nombre étant nécessairement non-négative, elle 
ne peut être nulle que si 


Aîf= wA? 


pour chaque système d'indices i = i(is ir rinle Or, ce ne sera le cas 
que si les fréquence f, sont des transformations linéaires des @y , c'est- 


à-dire 


. V= 1, 0; 
vie 2: Kog Pic 
imite AND 
ce qui donne 
k4 d Kin 
f 
A ="... N° 
Km . Kes 
Si fv et y, (V,T =1,2,...,n)sont indépendantes, R = 0, mais ici 


aussi R peut être nul sans que f, et @x; soient indépendantes, 


Remarquons que dans le cas où la répartition est continue, le déter- 
minant Q prendra la forme 


fact ones fecmacan. facon co 
us ar VAS 
eco f, (x) dx IETCICEE [eco f, (x) dx 

Q = 0 -æ = E— 


Jet (x) dx Jec0 008. ET (x) dx 


© —æ CL 1 
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F0) 8 Ge)... 0) [y (x) p,Cx,)... 9, (x,) 


Sud ‘NE fe O6) 8, 0)... 8 (1 lo, G) px). pe (xn) 
HP dx;... dx 
ROME 06). LE ON Pa CX) PnX2)... Pa(Xn) 


En remplaçant respectivement wi (x) et fi (x) par fi(x) et wi (x), on obtient 
les expressions correspondantes de P et S,. 


13. DIVISION D’UNE POPULATION EN DEUX SOUS-POPULATIONS 


Nous avons vu de quelle façon il a fallu diviser l'espace en deux 
sous-espaces R et RŸ afin de pouvoir entreprendre la classification des 
éléments particuliers de la population totale n=7,+m», par rapport aux po- 
pulations 1, et n,. Nous avons toujours supposé que les masses des po- 
pulations nm, et r2 étaient déjà séparées et que leurs lois de probabilité 
f,(x) et f:(x) nous étaient connues. Cependant, il se présente souvent le 
cas où nous connaissons la loi de probabilité de la populationn, sans 
connaître celles de I, et 7, . Par conséquent, le problème général de la 
classification présente deux étapes. La première étape consiste à partager 
la population totale en deux sous-populations d'après certaines indications 
où suppositions. Une fois ce partage effectué, on procède à la seconde 
étape, c'est-à-dire à la division de l'espace R“ en deux sous-espaces. 


Le point de départ de K Pearson (37) dans la division des masses 
était la supposition que les caractères des éléments de deux populations 
suivent des lois de Laplace, réduisant ainsi tout le problème à la déter- 
mination des moments et des coefficients de pondération des populations 
m, et 7x2 en vertu des moments connus de la population totale n . 


Dans le cas à une dimension les paramètres cherchés m,,m,, ©, ,02 

$ 2 : à : AE ; 2 ; 
et p = 1-q dépendraient alors de la racine bien choisie d'une équation 
nonique, construite à partir des cinq premiers moments de la population n . 


Nous nous proposons de considérer le cas où la forme des lois de 
probabilité f,(x) et f,(x) est inconnue, supposant seulement la connais- 
sance de la loi de probabilité w (x) de la population totale n et de la loi 
de révolution n,+ 7, c'est-à-dire la fonction K(x,Ë) , telle que 


+ co 


(13.1) 460 = [tk D 44. 


œ 


Les fonctions f, (x) et f, (x) doivent satisfaire la relation 
(1572) pf, (x) + qf, (x) = p (x) 


et en utilisant (13.1) on obtient 
S Î 
(1373) RE. f CŒK(X,E)dE= px), 


c'est-à-dire une équation intégrale singulière de Fredholm de seconde 
espèce avec le paramètre À = (p - 1) p < 0 et la fonction inconnue f; (x). 
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Avant de résoudre l'équation (13.3) prouvons le théorème suivant 


Théorème I. Le noyau itéré d'un noyau door une loi de ré- 
volution est une loi de révolution. 


Afin de démontrer ce théorème utilisons la Trraule de récurrence 
pour le v + l-ième itéré k,,,(x,&) du noyau K,=k(x,&) 
+ 


(13.4) K +1 pe KO RE pdt. 


Le théorème est vrai pour V = 1. Dans ce cas nous avons 


+ 


ke D = / ROC) CRE) dE: 


Vu la proprièté (10.3) du noyau k(x,ë), il est clair que le noyau itéré 
k,(x, Ë) sera lui aussi positif. De même 


+ + + 


KE ED dx = [front dt dx . 


D'après les hypothèses générales sur le noyau k(x,Ë), on peut échanger 


l'ordre des intégrations figurant au dernier membre. Il vient ainsi 
+ + +0 


ÉCOCS E at frcub és 


Vu la propriété (10.4) du noyau k (x,€) on obtient finalement 


fic dx = 1. 


Par conséquent le noyau itéré k,(x,£) représente li aussi une loi de ré- 
volution. Montrons maintenant que, si le théorème est vrai pour V , il sera 
vrai pour V +1. Dans ce cas on suppose que la fonction ky(x,8) satis- 
fait les conditions 


+ 


RER ME NE fe 0 


et on démontre d'une façon analogue, comme pour V = 1 
itéré ky+1 (x,6), donné par la formule de récurrence (13.4 
lui aussi une loi de révolution. 


, que le noyau 
) représente 


Corollaire I. Si la fonction f x) représente une loi de probabilité, la 
fonction 


+ 


front 


représente elle aussi une loi de probabilité. 
Corollaire IT. En désignant la loi de probabilité itérée par 


+ © 


F0) ee AOC FER) die 


- 


RE 
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nous pouvons écrire l'identité 


+ + 
feaniua = f k,Cx,t) f, (tidt. 


La démonstration est immédiate. 


Considérons à présent notre équation intégrale (13.3). En substituant 
la fonction f, (£) figurant dans l'intégrale du premier membre par 


, = deea / LRU) dé, 


et répétant indéfiniment ce même procédé, la fonction cherchée f, (x) sera 
donnée par la série 


+ 


Ter 
ES nn pE)kKAxX,E dde 


ou, vu le corollaire II du Théorème I, 
Î œo 
(13.5) f, (x) = 5 à MERE 


S'il existe un nombre positif M, tel que, quelque soit V et quelque soit x 
sur (-co,+00 ), on ait 


Pv(X) <M, 


la série qui figure dans le second membre de (13.5) sera convergente si 
IXI<1, a savoir p >+ 
D'autre partle paramètre p doit encore satisfaireles conditions pour 
que la fonction f, (x) représente elle aussi une loi de probabilité. On véri- 
fie immédiatement que la masse totale correspondant à la fonction f, (x) 
est égale à 1, 


+ + © 
l: CO dx = LE x / on (x) dx = 


La solution f, (x) doit être positive ; on constate alors que, pour une loi 
de probabilité donnée w (x) de la population totale n et pour une loi de ré- 
volution donnée k(x,Ë), les proportions des masses des populations n, et 
fn, ne peuvent pas être arbitraires. Leurs intervalles de variations dé- 


pendent essentiellement de k(x,&) et de (x). 


Si nous connaissons les fréquences par classe d'intervalles au lieu 
de la loi de probabilité, de la population c'est-à-dire les valeurs 


vh 


Po = p(x) dx, Ven 5.0, 


(v-Dh 


260 BRANISLAV V. IVANOVITCH 


h étant la longueur de l'intervalle de classe et n le nombre d'intervalles 
et si nous désignons par 
vh 


f, — ACCIONS Veil tn 


1v ? 


(v-1h 
vh 


Kio = RCE IR VC reine 
avec (v-1h 


l'équation intégrale (13.3) se réduit alors à un système de n équations li- 
néaires avec les inconnues f,, (V = 1,2,...,n) 


(13.6) pfo+ QË fig Ko = P, VE ere 


ou bien 
p/q + ku K4 . Kin fn Pi 
(13 71) k p/q +ka2 Kon LP E Pa 
haleine nr leuslats ve le sise #10 ss .… q …. 
Korn  Knz ---P/qtkon fin Pa 


Vu que les valeurs cherchées f,, (V = 1,2,...,n) représentent les fré- 
quences des masses de la population 17, , elles doivent être positives. Par 
conséquent, pour une répartition donnée ®y (V =1,2,...,n) et pour une 
loi de l'évolution donnéekx(v,6 = 1,2,...,n), les proportions des masses 
des populations ne peuvent pas, ici non plus, être arbitraires. Les fré- 
quences f», de la population T, seront ensuite trouvées par les formules 


(13.8) fau = + (Qu = Phi) : O =] 2 2.1). 


Exemple 13.1.- Soit la loi de Laplace 


-x2/?2»? 


EN = a\[2t 


la loi de probabilité de la population totale r et supposons que la variable 
aléatoire x de la population n, soit obtenue au moyen de la variable aléa- 
toire & de la population n, par la relation 


gare 
2 
où t représente aussi une variable aléatoire avec la loi de probabilité 
2 
1 -t [2 
r(t)= e x 


V2r 
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La loi de l'évolution aura la forme suivante 


re 
PPT 


et la loi de probabilité itérée deviendra 


30 £? 1(2 E)? 
— x+ 
p (x) = ri car dé — 
+ 


+ (2x+8)2 


+8? ,2 
Î -2x? sie CE2XE 
Dre DRE Le 
2x2 
se 2 1 e 71+a7 
Vita \/2n ) 
De même ; _x/20À 


Pa TE ; 


où l'écart-type ©, est donné par la formule de récurrence suivante 


De to ee 
(13.9) 4 
n= 1,2, : 
d'où 


{ 33? -1 
oO? = — + —— 
sa 3 CHR 


La suite \o! }est monotone ettend vers 17e quand n + co . Par conséquent, 
les lois de probabilité itérées seront Laplaciennes avec la moyenne arith- 
métique égale à zéro etles écarts-types variant entre a et V3/3 . Elles ne 
peuvent pas dégénérer en fonctions de Dirac, donc nous pouvons utiliser la 
formule (13.5) et nous obtenons ainsi 


2 _3.49 
OM E ar tm he Tr RÈT 
; py/2n ve 3a*-1 + 4° , 
x08 354% 
& C2 ve 79  331-1+14% 
f (x)= Î “ w HS hsleg ue 2 3a2-1+4 | 


NE 3a-1+4 


I1 reste encore à examiner la positivité des fonctions f, (x) et f,(x). Elles 
sont représentées par des séries alternées de fonctions. Or, elles seront 
certainement positives si l'inégalité 


este sait 
1 20) Î 20$,1 
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pour chaque V et pour chaque X sur (-0,+c). En utilisant la formule 
de récurrence (13.9), cette inégalité se réduit à 


7 -x?_30ÿ -1 
ae See 
< —————- 


206$ 


Considérons le cas où 0?> 1/3. L'inégalité ci-dessus sera satisfaite à plus 


forte raison si 
PARAIT 


20% 
où 
1-p ge Vi+ À 
p 2 =: Me 
d'où 


29% 


(13.10) LE Das, +\Trer. 


L'expression figurant dans le deuxième membre decette inégalité est une 
fonction de dy qui croit de 0 à 2/3 pendant que 0 croit de 0 à +00 . Etant 
donné que dans notre cas Oy varie entre V3/3 et a, l'inégalité (13.10) 
sera satisfaite pour chaque v si 


2a 
SE 
p 23+V1+a 


Deoc?>1/3, on en déduit quuea > \/3/3 à 


Les moyennes arithmétiques des populations T, et, sont m, = m, 
= 0 et les variances 


0 IR emma 
DZ = —} 1 

1 prive 3.4 

Fr L v 3a -1+4 
5e 

2 qe 34 


Exemple 13,11.- La mortalité infantile est encore toujours très éle- 
vée en dépit du fait qu'elle est en baisse régulière dans la plupart des pays 
grâce aux mesures de protection dont jouissent chaque jour davantage les 
nourissons et les futures mères. On peut diviser les décès en deux caté- 
gorie principales. Dans la première catégorie se classent les décès des 
enfants nés en bonne santé. Leurs fréquences sont basses au cours des 
premiers mois de l'existence pour devenir ensuite de plus en plus élevées 
au détriment de la deuxième catégorie où la mortalité est favorisée par 
des causes héréditaires ; débilité à la naissance, prématuration, sous- 
alimentation maternelle ; hérédité constitutionnelle, syphilis, tubercu- 
lose. Les fréquences de cette deuxième catégorie sont très élevées au 
cours des quatre premières semaines suivant la naissance. Le Tableau 
13.1 donne la répartition des enfants décédés au cours de la première an- 
née de vie en Suisse (1951) (38) d'après la durée de leur existence 
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TABLEAU 13.1 ENFANTS DECEDES AU COURS DE LA PREMIERE 


ANNEE DE VIE 
2467 


Ce Tableau donne les fréquences ®y (V = 1,2,3,4) de la population totale 
composée des populations décrites ci-dessus, I et I: . Dans le cas où 
les fréquences des populations 71, et —1: des années précédentes sont con- 
nues, nous avons vu dans le paragraphe Il comment il est possible de dé- 
terminer les coefficients Kvy qui permettent de résoudre le système (13.7) 
lorsque nous connaissons les valeurs p et q. Supposons que p = 20 % et 
q = 80 % et essayons de reconstruire les répartitions de fréquences des 
populations HT, et T1, sans connaitre leurs répartitions antérieures, 


Ages (en mois) 


De par la nature des deux populations nous pouvons supposer que n; 
se transforme en n, de telle façon que la durée de l'existence £ de la 
population 1, s'exprime au moyen de la durée de l'existence x de la popu- 
lation TN, par la relation 


x = TE PEU 


3 
où la probabilité du facteur de proportionnalité t doit être d'autant plus 
grande qu'il est plus petit. C'est pourquoi nous pouvons prendre 


-at 


p(ii=ae : 


où a est un paramètre pour le moment, inconnu. Les coefficients Kvz (V,C = 
1,2,3,4) deviendront 


vh ahv/8x 
ky=a/Le "sa | et dt. 
En ah(v-1)/84 


0 1 t 
Fig.3 


En prenant br comme point médian du & -ième intervalle, c'est-à-dire 


À =2/(24-1) 
[A 
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il vient 
ARE DRIVE 
kyy = e 7 sue sn , Vv,T= 1,2,3,4 
Les conditions 
K vg > 0 , VC = 12259354 
ñ 
Z ky = 1, = 294 


doivent être satisfaites, La première est toujours satisfaite. D'autre part, 
étant donné que 


Zikr= 1e FA , Cm l,2,01t, 


il est nécessaire que le paramètre a soit choisi de telle façon que l'erreur 
maximale exp. ( -8a/7) puisse être négligée. Pour a = 4, cette erreur 
s'élève à 1 % et les valeurs des coefficients kvy correspondantes sont 
données dans le Tableau 13.2 


TABLEAU 13.2 


0,99966 095075 079810 0,68018 


9,00034 9,06426 0,16114 0,21754 
0,00000 0,00465 0505253 997055 
9,00000 0,00034 0,90823 0,93175 


La solution du système 


1250 0,931 0,798 0,680 fn 1,028 
0 0,314 0,161 0,218 fy OPEL 
0 0 0,283 0,070 f, 11 0,068 
0 0 0,008 0,282 fu 0,048 


représentera la répartition de fréquences de la population n, . Le détermi- 
nant du système est À = 0,031104 et les fréquences relatives et absolues 
des populations nm, et 1, sont données dans les Tableaux 13.3 et 13.4 
respectivement. 


TABLEAU 13.3 


0,49906 0,13692 0,19950 0,16452 
0,89814 9,07700 0,01828 0,00658 
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TABLEAU 13.4 


à 7 de + _s 
HEC À. — 
ge mue a 


à 
4 


D AU re Fr | 

sn NA TRS 
tire nm bé 

tabtéeliés IN LEA) 
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